谷歌发布ReasoningBank，智能体从成败经验中提炼推理策略 - 快链头条_区块链世界的入口_行情资讯_技术解读_独家深度

谷歌发布ReasoningBank，智能体从成败经验中提炼推理策略

快链头条 2026-04-22 16:24:03

阅读 7,026

据动察 Beating 监测，谷歌研究院发布智能体记忆框架 ReasoningBank，让大模型驱动的智能体在部署后持续学习。核心做法是把过往任务的成功和失败经验都提炼成通用的推理策略存入记忆库，下次遇到类似任务先检索再执行。相关论文在 ICLR 发表，代码已在 GitHub 开源。

此前两类主流方案各有缺陷：Synapse 记录完整行动轨迹，粒度太细难迁移；Agent Workflow Memory 只从成功案例提炼工作流。ReasoningBank 改了两处：存储对象从「动作序列」换成「推理模式」，每条记忆含标题、描述、内容三段结构化字段；失败轨迹也纳入学习。模型调用另一个大模型对执行轨迹自评，失败经验被拆成防踩坑规则，例如从「看见 Load More 按钮就点」升级为「先核对当前页面标识，避免陷入无限滚动，再点击加载更多」。

论文另提出 Memory-aware Test-time Scaling（MaTTS），在推理时投入更多算力反复尝试，并把探索过程存入记忆库。并行扩展让智能体对同一任务跑多条不同轨迹，通过自对比提炼更稳健的策略；顺序扩展在单条轨迹内反复精修，把中间推理记入记忆库。

在 WebArena 浏览器任务和 SWE-Bench-Verified 代码任务两个基准上，用 Gemini 2.5 Flash 做 ReAct 智能体，ReasoningBank 相比无记忆基线在 WebArena 上成功率高 8.3%，SWE-Bench-Verified 上高 4.6%，每项任务平均少走约 3 步；叠加 MaTTS 并行扩展（k=5）后，WebArena 成功率再提 3 个百分点，步数再少 0.4 步。

生成图片

快链头条登载此文本着传递更多信息的缘由，并不代表赞同其观点或证实其描述。
文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。
投资有风险，入市须谨慎。本资讯不作为投资理财建议。

推荐活动

【Amplify2026—Quantifying&Growth In Web 4.0】

2026-04-21 14:00

香港 Web3 嘉年华 2026

2026-04-20 18:34

【Amplify2026—VENTURE HORIZON】

2026-04-20 14:00

7*24小时快讯

慢雾：macOS出现具有高度破坏性恶意软件，可窃取用户加密钱包等敏感数据

04-22 18:37(2分钟前)

Hyperliquid上短时7名巨鲸集体开空，清算均线位于81502美元

04-22 18:27(12分钟前)

微软搭建AI智能体时代的商业交易基础设施

04-22 18:27(12分钟前)

QCP：比特币本轮反弹更多由风险降低驱动，而非基本面改善

04-22 18:13(26分钟前)

NeoCognition获4000万美元种子轮，做能在岗学习的专业化AI智能体

04-22 18:10(30分钟前)

GMGN联创：网页端推出一系列更新以提升以太坊主网用户体验

04-22 18:09(30分钟前)

Vitalik：以太坊系统简化很重要，关注硬件层发展

04-22 18:03(36分钟前)

又一艘货轮在试图通过霍尔木兹海峡时遇袭

04-22 18:00(39分钟前)

热门资讯

四维共振：香港Web3嘉年华分论坛共绘全球金融新基建蓝图

2026-04-22 18:05:00

智链真资·香港RWI峰会圆满落幕：AI×RWA融合开启产业新篇章

2026-04-21 11:13:14

当头部加密 VC 规模全面缩水，为何这家机构还能增长 150%

2026-04-20 18:56:47

a16z 新文：预测市场，进入快进阶段

2026-04-20 09:31:57

风险提示

根据银保监会等五部门于 2018 年 8月发布《关于防范以「虚拟货币」「区块链」名义进行非法集资的风险提示》的文件，请广大公众理性看待区块链，不要盲目相信天花乱坠的承诺，树立正确的货币观念和投资理念，切实提高风险意识；对发现的违法犯罪线索，可积极向有关部门举报反映。