ARC-AGI-3公布史上最大规模人类测试：所有关卡均被人类攻克，AI仍有差距 - 快链头条_区块链世界的入口_行情资讯_技术解读_独家深度

ARC-AGI-3公布史上最大规模人类测试：所有关卡均被人类攻克，AI仍有差距

快链头条 2026-04-15 13:58:45

阅读 1,102

据动察Beating 监测，ARC Prize 基金会公布了 ARC-AGI-3 的人类表现数据集，这是 ARC-AGI 系列迄今规模最大的人类测试研究，共 458 名参与者。数据集包含 342 条完整的人类操作回放记录，覆盖 25 个公开环境，已全部开源。

ARC-AGI-3 包含 135 个抽象推理环境，测试者不会收到任何玩法说明，必须自行探索、推断规则并制定策略。测试在旧金山的线下测试中心进行，每场 90 分钟，参与者获得约 130 美元底薪加每通关一个环境 5 美元奖励。所有测试均为「首次通关」条件，即每人只看一次、只尝试一次，衡量的是面对全新问题时的学习和适应能力。人类和 AI 获得完全相同的信息，没有任何信息差。

核心结论：ARC-AGI-3 的所有环境均被人类通关，每个环境至少有两名独立参与者完成，多数环境有五人以上通关。ARC Prize 基金会称「我们还没有实现 AGI，这份数据集就是证据」。

自 ARC-AGI-3 预览以来，公开环境已收到近 100 万份 AI 评测提交。基于这些数据，基金会同时宣布两项评分规则调整：一是将每关的人类基准从「第二好的玩家」改为「中位数玩家」，降低运气因素对得分的影响；二是将单关得分上限从 100% 提高到 115%，避免一关表现不佳拖垮整体成绩。两项调整的净效果是人类和 AI 得分均小幅上升约 0.5 个百分点。

生成图片

快链头条登载此文本着传递更多信息的缘由，并不代表赞同其观点或证实其描述。
文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。
投资有风险，入市须谨慎。本资讯不作为投资理财建议。

推荐活动

Consensus Hong Kong 2026

2026-02-10 08:00

2026 Consensus The Silent Rise

2026-02-09 13:30

7*24小时快讯

美国国税局实施新的数字资产申报标准以遏制逃税行为

04-15 16:03(7分钟前)

LI.FI推出面向机构的链上收益产品LI.FI Earn

04-15 15:53(17分钟前)

Coinbase将于5月7日发布一季度财报并举行线上说明会

04-15 15:51(19分钟前)

「妖币」集体回落，龙头币RAVE近4小时跌超23%

04-15 15:44(26分钟前)

伊朗将使用除南部港口以外的替代港口，以绕过美国封锁

04-15 15:41(29分钟前)

马斯克晒AI5芯片实物照，此前搁置的训练芯片Dojo也回来了

04-15 15:31(38分钟前)

昨日比特币ETF净流入4.114亿美元，以太坊ETF净流入5310万美元

04-15 15:31(39分钟前)

传DeepSeek-R1核心作者郭达雅已入职字节跳动

04-15 15:17(1小时前)

热门资讯

YZi Labs 投资数千万美元，CZ 担任顾问，Genius 仍缺信众

2026-04-14 17:52:26

Hyperliquid 万字特写：Jeffrey 百亿美金的掘金故事

2026-04-14 16:06:53

Real World Intelligence (RWI) — Hong Kong RWI Catalyst Summit 啟動，聚焦 AI 與真實世界資產的融合

2026-04-14 14:09:35

公链“大撒币”时代终结

2026-04-14 08:17:30

风险提示

根据银保监会等五部门于 2018 年 8月发布《关于防范以「虚拟货币」「区块链」名义进行非法集资的风险提示》的文件，请广大公众理性看待区块链，不要盲目相信天花乱坠的承诺，树立正确的货币观念和投资理念，切实提高风险意识；对发现的违法犯罪线索，可积极向有关部门举报反映。