星期四
04 / 17
OpenAI首个行业专用模型GPT-Rosalind瞄准制药,RNA预测超过95%人类专家
星期四 2026-04-17 08:22

据 动察Beating 监测,OpenAI 发布 GPT-Rosalind,这是该公司首个针对特定行业构建的前沿推理模型,面向生物学、药物发现和转化医学。模型以对揭示 DNA 结构做出关键贡献的科学家 Rosalind Franklin 命名,目前作为研究预览版在 ChatGPT、Codex 和 API 上线,仅面向通过资质审核的美国企业客户开放,预览期间不消耗现有额度。

选择生命科学作为第一个垂直行业,本身就是一个战略信号。OpenAI 给出的理由是:一款新药从靶点发现到获批上市平均需要 10 至 15 年,AI 在早期发现阶段的提速会向下游复利式传导,更好的靶点选择、更强的生物学假设、更高质量的实验设计,最终提高整条管线的成功率。

性能方面,GPT-Rosalind 在生物信息学基准 BixBench 上取得已公开模型中的最高分。在涵盖文献检索、序列操作、实验方案设计等 11 项研究任务的 LABBench2 基准上,6 项超过 GPT-5.4,提升最显著的是分子克隆实验设计(CloningQA)。与 AI 基因治疗公司 Dyno Therapeutics 合作的评测使用了未公开、未被训练数据污染的 RNA 序列,模型十次提交中的最优结果在序列功能预测上排在人类专家历史成绩的第 95 百分位以上,序列生成排在第 84 百分位左右。

OpenAI 同时在 GitHub 开源了 Codex 生命科学研究插件,接入超过 50 个公共多组学数据库、文献源和生物工具,覆盖人类遗传学、功能基因组学、蛋白质结构、生物化学等领域。插件所有用户均可免费使用,不限于 GPT-Rosalind,也可搭配通用模型。Amgen、Moderna、Allen Institute、Thermo Fisher Scientific 等已参与早期合作,OpenAI 还与洛斯阿拉莫斯国家实验室探索 AI 引导的蛋白质和催化剂设计。GPT-Rosalind 是其生命科学模型系列的首个版本,后续将持续扩展生化推理能力。