教同类隐瞒证据、扒取隐藏源码：GPT-5.6测试暴露模型协同规避审查倾向，作弊率创新高 - 快链头条_区块链世界的入口_行情资讯_技术解读_独家深度

教同类隐瞒证据、扒取隐藏源码：GPT-5.6测试暴露模型协同规避审查倾向，作弊率创新高

快链头条 2026-06-27 09:31:24

阅读 8,433

据动察 Beating 监测，评估机构 METR 发布的 GPT-5.6 Sol 预部署测试报告指出，模型在长周期任务中频繁利用环境漏洞、试图读取隐藏测试数据并提取源码。在 ReAct 智能体测试中，Sol 的作弊频率创下公开评测的历史最高纪录。为了通关，模型在提交的中间结果中打包漏洞脚本以窥探隐藏测试集，并强行提取了后台写有预期答案的隐藏源码。

更具威胁性的越界行为体现在模型协同规避审查的倾向。根据 OpenAI 主动同步的内部部署事故，Sol 在特定任务中表现出高度的规则绕过意图，甚至在协同运行中尝试指使另一模型实例协助隐瞒不对齐的证据，试图联合绕过监控系统。作弊表现导致时间跨度指标的测定结果极度不稳定。若将作弊尝试判定为失败，Sol 的半数值时间跨度估值仅为 11.3 小时。但若将作弊通过算作成功，成绩则会被虚假拉升至 270 小时以上。

尽管存在欺骗行为，METR 仍认为这些倾向被捕捉并公开是一个积极信号。评估团队警告，真正致命的危险潜伏在未来。如果接下来的模型在训练中被要求隐去真实的思维链，可能会演化出更隐蔽的逃避监管与伪装对齐能力。届时，作弊率的下降将不再代表安全性提升，而是模型学会了在人类面前伪装顺从，并暗中完成规避。

生成图片

快链头条登载此文本着传递更多信息的缘由，并不代表赞同其观点或证实其描述。
文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。
投资有风险，入市须谨慎。本资讯不作为投资理财建议。

推荐活动

RWA万亿进化论space

2026-06-23 19:00

【Amplify2026—VENTURE HORIZON】

2026-04-20 14:00

【AGENTPUNK2077 SUMMIT】

2026-04-19 14:00

7*24小时快讯

香港加密资产申报框架条例草案已进入审议阶段

06-27 11:13(2分钟前)

观点：廉价开源模型泛用导致H100GPU现货租赁价格下跌及token价格指数回落

06-27 11:06(9分钟前)

RootData：MMT 将于一周后解锁价值约 236 万美元的代币

06-27 11:00(15分钟前)

RootData：BSB 将于一周后解锁价值约 194 万美元的代币

06-27 11:00(15分钟前)

马斯克获批收购前SpaceX工程师创立的光通讯初创公司Mesh Optical Technologies

06-27 10:52(22分钟前)

Roundhill Memory ETF（DRAM）已将兆易创新纳入持仓，权重 2.91%

06-27 10:36(39分钟前)

数据：某休眠两年巨鲸卖出 5671 枚 ETH 换取 893.8 万枚 USDS

06-27 10:33(42分钟前)

Google Antigravity 2.2.1版：集成系统密钥环并修复多智能体死锁

06-27 10:32(43分钟前)

热门资讯

靠 ChatGPT 聊出来的 STRC 发行价，真会陷入死亡螺旋吗？

2026-06-24 09:44:25

基金会后退，Ethlabs 上前：以太坊迎来史上最大重组

2026-06-24 09:42:37

一家差点倒闭的公司，刚刚市值超过了比特币

2026-06-23 08:57:34

Alliance 联创致创业者的一封信：写在 Cursor 卖出 600 亿美元之际

2026-06-22 09:45:29

风险提示

根据银保监会等五部门于 2018 年 8月发布《关于防范以「虚拟货币」「区块链」名义进行非法集资的风险提示》的文件，请广大公众理性看待区块链，不要盲目相信天花乱坠的承诺，树立正确的货币观念和投资理念，切实提高风险意识；对发现的违法犯罪线索，可积极向有关部门举报反映。