前字节Seed工程师：字节一轮迭代要半年，谷歌传闻只需三个月

星期四

04 / 24

星期四 2026-04-24 16:40

据动察 Beating 监测，前字节跳动 Seed 团队工程师、现北京大学助理教授张驰在播客《Into Asia》中透露，字节跳动完成一轮大模型训练（预训练加后训练）需要约半年，而谷歌据传闻只需三个月。他认为迭代速度是中国公司追赶困难的核心原因之一。张驰在字节约一年，所在的数学团队偏研究性质，他自述该组的定位「更多是为了宣传」，与负责模型交付的预训练和后训练团队不同。

张驰描述了 Seed 内部的 benchmaxxing（刷分）文化：团队领导按负责的 benchmark 评估绩效，所有人都在冲分数，「但这不能转化为实际使用中的好体验」。他说纸面上中国大公司的模型都能追平美国前沿模型，但实际用起来「不够好」。Seed 的目标是全球顶尖，「但很遗憾，我不认为我们追上了」，即使是国内第一的目标「也没有实现」。2024 年底 Seed 自认追平 GPT-4o，随后 DeepSeek 发布，团队意识到差距仍在，他加入时全组正紧急转向强化学习。