Nous开源Lighthouse Attention:单B200跑512K提速17倍
快链头条 2026-05-16 21:57:01
据动察 Beating 监测,Nous Research 开源了长上下文预训练机制 Lighthouse Attention。在单张 B200 显卡上处理 512K 长度文本时,该方案的计算速度比传统机制快约 17 倍,并在 98K 长度下实现了 1.4 到 1.7 倍的端到端训练提速。
传统注意力机制需要计算所有字词的两两关系,文本一长,算力消耗就会呈平方级暴涨。Lighthouse Attention 改用先粗筛再精算的思路。它会先在不同层级快速浏览文本的压缩摘要,通过打分挑出核心片段拼成短文本,然后直接交给现成的高效算子 FlashAttention 处理。由于筛选逻辑被彻底剥离到了内核之外,开发者直接省去了手写底层代码的麻烦,也不用增加额外的训练目标。
过去采用类似思路的加速方案常有副作用,模型习惯跳跃阅读后,极易丧失原本逐字精读的能力。为了避开这个陷阱,研发团队让模型先用加速模式跑完绝大部分进度,只在训练末尾短暂切回传统的全注意力计算稍作适应。在针对 5.3 亿参数规模的模型、投喂 500 亿 Token 训练数据的实测中,这样练出的模型不仅大幅缩短了耗时,最终表现还全面追平甚至反超了全程使用传统方式训练的基线版本。
快链头条登载此文本着传递更多信息的缘由,并不代表赞同其观点或证实其描述。
文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
投资有风险,入市须谨慎。本资讯不作为投资理财建议。
7*24小时快讯
美联储6月维持利率不变的概率现报98.7%
05-16 23:57(32分钟前)
过去24小时全网爆仓4.66亿美元,主爆多单
05-16 23:45(44分钟前)
当前主流CEX、DEX资金费率显示市场看跌态势加深
05-16 23:44(1小时前)
WhatsApp将在与Meta的AI聊天中新增「无痕模式」
05-16 23:22(1小时前)
Argentum AI与云计算公司及房地产企业签署25亿美元数据中心协议
05-16 22:51(2小时前)
微信读书上线专属Skill,支持AI直连个人书架与阅读笔记
05-16 22:14(2小时前)
观察:上万名AI核心员工赚足2000万美元,加剧硅谷阶层焦虑
05-16 22:09(2小时前)
Nous开源Lighthouse Attention:单B200跑512K提速17倍
05-16 21:57(3小时前)
热门资讯
风险提示
根据银保监会等五部门于 2018 年 8月发布《关于防范以「虚拟货币」「区块链」名义进行非法集资的风险提示》的文件, 请广大公众理性看待区块链,不要盲目相信天花乱坠的承诺,树立正确的货币观念和投资理念,切实提高风险意识;对发现的违法犯罪线索,可积极向有关部门举报反映。