星期二
05 / 13
GPT-5.5智商136登顶!新平台AIIQ用人类量表给大模型排座次
星期二 2026-05-13 19:35

据动察 Beating 监测,开发者 Ryan Shea 上线了新平台 AI IQ(aiiq.org),把前沿大模型全部放到人类 IQ 钟形曲线上,用一个数字直观回答「这个模型到底有多聪明」。目前官网数据显示,在重点受测的模型中:
• GPT-5.5:136 分(居榜首)
• Claude Opus 4.7 与 Gemini 3.1 Pro:并列 132 分
• Grok 4.3:125 分
• Kimi K2.6:122 分
• DeepSeek V4 Pro 与 Muse Spark:并列 117 分
• Qwen3.6:108 分

平台的算法机制从公开排行榜抓取 12 项基准的原始分数,用校准过的难度曲线换算成隐含 IQ,再按抽象推理、数学推理、编程推理、学术推理四个维度取均值。缺数据的维度会被保守填充,模型不会因为少跑基准就显得更聪明。由于底层数据全部来自已有基准,AI IQ 本身不做新测试,其核心价值是把散落各处的跑分翻译成普通人一看就懂的尺度。

除了综合智商排名,网站还提供几个交叉视图。用户能在「IQ 对成本」图表里直观筛选性价比,或在「前沿 IQ 时间线」里看各厂的进化斜率。此外,平台还叠加了 EQ-Bench 测出的情商(EQ)得分,用来衡量模型「会不会好好说话」。