乐天发布「日本最大高性能AI」Rakuten AI 3.0，配置文件暴露底层架构为DeepSeek V3

星期一

03 / 17

星期一 2026-03-17 16:45

据 1M AI News 监测，乐天集团今日以「日本最大高性能AI模型」为名发布 Rakuten AI 3.0，以 Apache 2.0 协议免费开源。该模型为 MoE（混合专家）架构，总参数671B，每次推理激活37B，上下文窗口128K，针对日语优化，在多项日语基准测试中超越 GPT-4o。

该模型系经济产业省与新能源产业技术综合开发机构（NEDO）联合推进的 GENIAC 项目成果，日本政府为其提供了部分训练算力资助。乐天在公告中以「充分利用开源社区最优成果」描述基础模型来源，未点名具体模型。

社区随即查阅 HuggingFace 上发布的模型文件，发现 config.json 中明确写入 model_type: deepseek_v3 与 `architectures: DeepseekV3ForCausalLM`，总参数671B、激活37B、上下文128K 亦与 DeepSeek V3 完全一致，表明该模型系在 DeepSeek V3 基础上经日语数据微调而来。