为什么你的Agent跑几分钟就罢工？OpenAI工程师：它需要记分牌和外挂记忆 - 快链头条_区块链世界的入口_行情资讯_技术解读_独家深度

为什么你的Agent跑几分钟就罢工？OpenAI工程师：它需要记分牌和外挂记忆

快链头条 2026-05-12 18:41:44

阅读 5,615

据动察 Beating 监测，Codex 的 /goal 模式能让 Agent 不断循环直到完成任务，但这放大了人类含糊其辞的提示词缺陷。OpenAI 工程师 Chris Hayduk 根据内部实操经验指出，像「优化代码」这种模糊指令，会让模型因不知道何为终点而过早放弃，或是陷入盲目修改的死循环。

要让 Agent 稳定打工数天甚至更久，他总结了三条纪律：
- 消灭定性词，用清单替代：模型无法评估什么是「更好」，但能理解「在不挂测试前提下缩短 20% 耗时」。面对论文排版等定性任务时，他甚至直接扔给 Codex 一份包含 200 条格式要求的 Markdown 清单，把抽象任务暴力转化为定量任务——「把勾打满即为完成」。
- 把验证耗时压到分钟级：Agent 需要通过测试来验证动作是否有效。不要让它在庞大的生产环境中跑几个小时，给它抽样数据集和轻型框架，让反馈循环越短越好。
- 建三个文件当「外脑」：即使上下文窗口再大，连跑几天也会丢记忆。他建议直接在本地建三个 Markdown 文件：PLAN.md（宏观计划）、EXPERIMENTS.md（实验得失记录）和 EXPERIMENT_NOTES.md（实时思考草稿），强迫模型把试错过程写在硬盘里。

生成图片

快链头条登载此文本着传递更多信息的缘由，并不代表赞同其观点或证实其描述。
文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。
投资有风险，入市须谨慎。本资讯不作为投资理财建议。

推荐活动

【Amplify2026—Quantifying&Growth In Web 4.0】

2026-04-21 14:00

香港 Web3 嘉年华 2026

2026-04-20 18:34

【Amplify2026—VENTURE HORIZON】

2026-04-20 14:00

7*24小时快讯

德意志银行：将英特尔目标价从63美元上调至100美元

05-12 19:01(19分钟前)

提速4倍且不爆显存，MIT与英伟达发布Lightning OPD：砍掉大模型蒸馏的实时教师服务

05-12 19:00(20分钟前)

eBay已拒绝游戏驿站提出的约560亿美元收购要约

05-12 19:00(20分钟前)

英伟达创始人黄仁勋：AI不会抢走你的工作，但是比你更懂AI的人会

05-12 18:47(33分钟前)

为什么你的Agent跑几分钟就罢工？OpenAI工程师：它需要记分牌和外挂记忆

05-12 18:41(39分钟前)

豆包输入法Mac正式版上线：主打豆包同款语音与中英混输

05-12 18:38(43分钟前)

Wintermute：本次上涨明显由杠杆驱动，未平仓合约激增伴随现货成交量走低

05-12 18:37(43分钟前)

Bybit：RWA代币化将推动印度万亿美元金融科技产业发展

05-12 18:15(1小时前)

热门资讯

为何 Coinbase 会是 AI 金融时代的最大赢家？

2026-05-11 18:53:44

3 分钟看懂如何申购 Bitget IPO Prime 项目 OpenAI（preOPAI）

2026-05-11 18:53:06

刚刚，美股登记龙头被加密交易所出价 42 亿美元买下！

2026-05-09 17:48:20

我 8 年来的从业感悟与加密革命

2026-05-09 15:29:45

风险提示

根据银保监会等五部门于 2018 年 8月发布《关于防范以「虚拟货币」「区块链」名义进行非法集资的风险提示》的文件，请广大公众理性看待区块链，不要盲目相信天花乱坠的承诺，树立正确的货币观念和投资理念，切实提高风险意识；对发现的违法犯罪线索，可积极向有关部门举报反映。