GPT-5与Gemini在甲骨文前全军覆没,腾讯发布首个古文字评测基准Chronicles-OCR
快链头条 2026-05-18 19:54:55
据动察 Beating 监测,腾讯混元及 SSV 数字文化实验室联合中科院信工所等机构,正式推出首个覆盖「七体之变」的古文字感知评测基准 Chronicles-OCR。该基准包含 2800 张由专家交叉标注的图像,首次将甲骨文到草书等七种字体的识别难度统一量化。
研究团队评测了 28 个主流多模态大语言模型,结果显示它们在古早字体上几乎全军覆没。在跨时代字符检测任务中,GPT-5 和 Gemini 2.5 Pro 的核心指标接近 0,表现最强的模型也仅有 16.5。即使直接在图上画框免除定位步骤,最高准确率也只有 27.1%,其中 Gemini 3.1 Pro 在甲骨文上的准确率仅 14.0%。
这证实了现代模型严重依赖规整的现代版式先验。面对无约束、强噪声的古代物理介质,模型的文本分割机制直接失效。字体分类结果进一步表明,模型往往是在识别载体纹理(如龟甲或青铜锈),而非真正的字符笔画。
实验还揭示了一个反直觉的现象:开启思考模式反而会导致古文字识别率下降。对照显示,几乎所有支持该模式的模型在开启思考后表现退化。当底层视觉感知缺失时,思维链不仅无法纠错,反而会变成幻觉放大器,输出高自信的错误答案。
快链头条登载此文本着传递更多信息的缘由,并不代表赞同其观点或证实其描述。
文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
投资有风险,入市须谨慎。本资讯不作为投资理财建议。
7*24小时快讯
伊朗提议长期多阶段停火,可以将浓缩铀无条件转移至俄罗斯
05-18 20:52(4分钟前)
数据:链上RWA规模创历史新高,达337亿美元
05-18 20:48(8分钟前)
AI审计公司Calibre完成330万美元Pre-Seed融资,Vicus Ventures与CIV领投
05-18 20:43(13分钟前)
Tom Lee:ETH近期跌破2200美元是「具有吸引力的买入机会」
05-18 20:40(16分钟前)
彭博社:伊朗启动「比特币支持」的霍尔木兹海峡航运保险机制
05-18 20:37(19分钟前)
Bitmine上周增持约7.32万枚ETH,总持仓量升至528万枚
05-18 20:32(24分钟前)
CNBC:欧洲或数周内面临石油短缺,库存下降速度远超预期
05-18 20:25(31分钟前)
分析:特朗普政府正探索以「持股」方式扶持关键企业,英特尔为典型案例
05-18 20:23(33分钟前)
热门资讯
风险提示
根据银保监会等五部门于 2018 年 8月发布《关于防范以「虚拟货币」「区块链」名义进行非法集资的风险提示》的文件, 请广大公众理性看待区块链,不要盲目相信天花乱坠的承诺,树立正确的货币观念和投资理念,切实提高风险意识;对发现的违法犯罪线索,可积极向有关部门举报反映。