据动察 Beating 监测,前字节跳动 Seed 团队工程师、现北京大学助理教授张驰在播客《Into Asia》中透露,字节跳动完成一轮大模型训练(预训练加后训练)需要约半年,而谷歌据传闻只需三个月。他认为迭代速度是中国公司追赶困难的核心原因之一。张驰在字节约一年,所在的数学团队偏研究性质,他自述该组的定位「更多是为了宣传」,与负责模型交付的预训练和后训练团队不同。
张驰描述了 Seed 内部的 benchmaxxing(刷分)文化:团队领导按负责的 benchmark 评估绩效,所有人都在冲分数,「但这不能转化为实际使用中的好体验」。他说纸面上中国大公司的模型都能追平美国前沿模型,但实际用起来「不够好」。Seed 的目标是全球顶尖,「但很遗憾,我不认为我们追上了」,即使是国内第一的目标「也没有实现」。2024 年底 Seed 自认追平 GPT-4o,随后 DeepSeek 发布,团队意识到差距仍在,他加入时全组正紧急转向强化学习。