Claude Code团队详解百万token上下文管理：模型在压缩摘要时智力最低，rewind才是最该养成的习惯

星期三

04 / 16

星期三 2026-04-16 12:47

据动察 Beating 监测，Anthropic Claude Code 团队工程师 Thariq Shihipar 发布长帖，系统讲解 Claude Code 升级到 100 万 token 上下文窗口后如何管理会话，同时宣布更新了 /usage 面板，帮助用户了解自己的使用模式。

帖子的核心概念是「上下文腐烂」（context rot）：随着对话变长，模型注意力被分散到越来越多的 token 上，旧的、无关内容开始干扰当前任务，模型表现因此下降。百万上下文让任务跨度更长，但并不意味着可以无限堆积对话。

Shihipar 认为用户最该养成的习惯是 rewind（双击 Esc 键）。当 Claude 尝试了一种方案但失败时，多数人的本能是发一句「这个不行，试试 X」，但更好的做法是回退到方案执行前，把失败经验写进新提示词重新来过，而不是让失败的中间过程留在上下文里占用注意力。

关于上下文压缩（compaction），他指出一个反直觉的问题：模型在最需要聪明的时候反而最笨。压缩发生在上下文即将撑满的时刻，此时上下文腐烂最严重，模型判断力最差，容易丢掉关键信息。典型场景是一轮长时间的调试后触发自动压缩，模型把摘要聚焦在调试过程上，而用户下一步想处理的其他问题被丢弃了。百万上下文给了用户更多余裕，可以在手动输入 /compact 时附加指令（如「只保留 auth 重构相关内容」），主动引导压缩方向。

他还建议将子代理（subagents）视为上下文管理工具：把会产生大量中间输出、但只需要最终结论的任务交给子代理，在独立的上下文窗口中完成，只将结果带回主会话。判断标准是「我需要的是过程还是结论」。

用户在每一轮对话结束后实际上面临五个选择：继续对话、rewind 回退重试、/clear 清空重新开始、/compact 压缩继续、或派出子代理。新任务开新会话，相关任务（如刚写完功能接着写文档）可以留在同一会话以复用已读取的文件。