GPT-5.5智商136登顶！新平台AIIQ用人类量表给大模型排座次

星期二

05 / 13

星期二 2026-05-13 19:35

据动察 Beating 监测，开发者 Ryan Shea 上线了新平台 AI IQ（aiiq.org），把前沿大模型全部放到人类 IQ 钟形曲线上，用一个数字直观回答「这个模型到底有多聪明」。目前官网数据显示，在重点受测的模型中：
• GPT-5.5：136 分（居榜首）
• Claude Opus 4.7 与 Gemini 3.1 Pro：并列 132 分
• Grok 4.3：125 分
• Kimi K2.6：122 分
• DeepSeek V4 Pro 与 Muse Spark：并列 117 分
• Qwen3.6：108 分

平台的算法机制从公开排行榜抓取 12 项基准的原始分数，用校准过的难度曲线换算成隐含 IQ，再按抽象推理、数学推理、编程推理、学术推理四个维度取均值。缺数据的维度会被保守填充，模型不会因为少跑基准就显得更聪明。由于底层数据全部来自已有基准，AI IQ 本身不做新测试，其核心价值是把散落各处的跑分翻译成普通人一看就懂的尺度。

除了综合智商排名，网站还提供几个交叉视图。用户能在「IQ 对成本」图表里直观筛选性价比，或在「前沿 IQ 时间线」里看各厂的进化斜率。此外，平台还叠加了 EQ-Bench 测出的情商（EQ）得分，用来衡量模型「会不会好好说话」。