乐天发布「日本最大高性能AI」Rakuten AI 3.0,配置文件暴露底层架构为DeepSeek V3
快链头条 2026-03-17 16:45:36
据 1M AI News 监测,乐天集团今日以「日本最大高性能AI模型」为名发布 Rakuten AI 3.0,以 Apache 2.0 协议免费开源。该模型为 MoE(混合专家)架构,总参数671B,每次推理激活37B,上下文窗口128K,针对日语优化,在多项日语基准测试中超越 GPT-4o。
该模型系经济产业省与新能源产业技术综合开发机构(NEDO)联合推进的 GENIAC 项目成果,日本政府为其提供了部分训练算力资助。乐天在公告中以「充分利用开源社区最优成果」描述基础模型来源,未点名具体模型。
社区随即查阅 HuggingFace 上发布的模型文件,发现 config.json 中明确写入 model_type: deepseek_v3 与 `architectures: DeepseekV3ForCausalLM`,总参数671B、激活37B、上下文128K 亦与 DeepSeek V3 完全一致,表明该模型系在 DeepSeek V3 基础上经日语数据微调而来。
快链头条登载此文本着传递更多信息的缘由,并不代表赞同其观点或证实其描述。
文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
投资有风险,入市须谨慎。本资讯不作为投资理财建议。
7*24小时快讯
比特币四年来首次出现8连涨,后续表现中位数为涨19%
03-17 18:22(4分钟前)
Ondo代币化股票将上线Bitget现货交易
03-17 18:15(12分钟前)
Wintermute:需关注比特币7.4万美元和8万美元的关键阻力位
03-17 18:08(18分钟前)
一新地址投入3.87万美元,预测「Extended上线首日FDV超过3亿美元」
03-17 18:04(22分钟前)
不听律师听ChatGPT:Krafton CEO用AI策划规避2.5亿美元合同,在特拉华法院惨败
03-17 17:56(30分钟前)
VVV鲸鱼持币者开始抛售代币,币价24小时跌超8%
03-17 17:50(36分钟前)
伊朗方面回应领导人被击毙:伊朗最高国家安全委员会秘书发表文件、伊朗新任最高领导人参加外交政策会议
03-17 17:42(1小时前)
以色列国防部长确认击毙伊朗最高国家安全委员会秘书
03-17 17:36(1小时前)
热门资讯
风险提示
根据银保监会等五部门于 2018 年 8月发布《关于防范以「虚拟货币」「区块链」名义进行非法集资的风险提示》的文件, 请广大公众理性看待区块链,不要盲目相信天花乱坠的承诺,树立正确的货币观念和投资理念,切实提高风险意识;对发现的违法犯罪线索,可积极向有关部门举报反映。