KAIROS:藏在 Claude Code 里的守护模式
Claude Code 源代码泄露揭示了 KAIROS——一个自主守护模式,让 Claude Code 变成常驻后台 agent,还能在用户空闲时自动整理记忆。
一句话概括: 泄露的 Claude Code 源代码中有超过 150 处引用了一个叫 KAIROS 的 feature flag。它是一个守护模式——一个持久运行的后台 agent,监控你的开发环境、跨会话保持上下文、在你不用电脑的时候自动进行「记忆整合」。KAIROS 还没上线,藏在内部 feature flag 后面。但它的架构揭示了 Anthropic 认为 AI 编程工具的未来方向:从被动助手变成常驻开发搭档。
KAIROS 在 Claude Code 里是什么
根据泄露的源代码,KAIROS 是一个被引用了超过 150 次的内部 feature flag。这不是个小实验——引用的数量和分布范围说明它是一个深度集成的子系统,涉及会话管理、上下文处理、后台任务调度和记忆操作。
KAIROS 代表了一次根本性的架构转变。今天的 Claude Code 是一个被动工具——你调用它,它回应你,交互结束。KAIROS 把这个模式彻底改了。在 KAIROS 下,Claude Code 变成一个持久进程——一个 daemon——在你的开发环境后台持续运行。
这个 flag 目前对所有外部用户都是关闭的。没有公开文档,没有公告,设置里也没有开关。我们知道的一切都来自泄露的源代码。
Claude Code 的守护模式怎么运作
KAIROS 让 Claude Code 从一个请求-响应工具变成一个长期运行的后台进程。泄露源代码显示,守护模式引入了两个核心能力:后台会话和持久上下文。
后台会话意味着 Claude Code 不会在你关闭对话时终止。daemon 继续运行,保持对你项目状态的感知——监控文件变动、追踪终端输出、观察开发活动,不需要你显式调用。
持久上下文意味着 agent 跨会话保留理解。今天每个 Claude Code 会话都从空白上下文开始(除了 CLAUDE.md 文件和项目索引)。在 KAIROS 下,daemon 随时间积累观察,逐步构建对你代码库、你的模式和你意图的更丰富的模型。
这两者结合起来很有分量。一个拥有持久上下文的 daemon 不仅仅是你用的工具,而是一个持续从你的环境中学习的进程。
autoDream:Claude Code 的记忆整合
KAIROS 里最引人注目的子系统是源代码中叫 autoDream 的进程。
泄露代码显示,autoDream 在用户不活跃时激活。当开发者处于空闲状态——不打字、不执行命令、不跟 Claude Code 交互——daemon 进入整合阶段。在这个阶段,agent 处理它积累的观察并重构内部上下文。
源代码描述了 autoDream 执行的三个具体操作:
-
合并分散的观察。 agent 把来自不同会话、不同文件、不同交互的信息合并成统一的表示。关于你代码库的孤立事实被串联起来。
-
消除逻辑矛盾。 如果 agent 记录了冲突信息——比如观察到一次重构使之前的假设失效——autoDream 通过丢弃过时数据来解决冲突。
-
将模糊洞察升级为确定事实。 这是最激进的操作。试探性的观察(「这个函数可能处理认证」)基于积累的证据被提升为确定性断言(「这个函数处理认证」)。
这一切都在没有用户参与的情况下发生。开发者不会审批整合过程,不会审查什么被合并了、什么被丢弃了、什么被提升了。daemon 在空闲时间自主执行这些操作。
autoDream 在架构上类似生物系统中的记忆巩固——短期记忆在睡眠期间转化为长期存储的过程。命名似乎是有意为之。
KAIROS 为什么改变了 AI 编程的范式
当下所有主流 AI 编程工具——Cursor、GitHub Copilot、Windsurf,包括当前形态的 Claude Code——都基于同一个交互模型:用户提问,AI 回答。循环永远由人发起。
KAIROS 打破了这个循环。
在守护模式下,交互模型从「问 AI、得到答案」变成「AI 观察、AI 学习、AI 行动」。agent 不等你下指令。它观察,积累理解,自主整合。根据泄露代码中可见的架构,它还能基于学到的东西主动提供洞察和执行操作。
这不是渐进式改进,是品类级别的变化。
最贴切的类比是文本编辑器进化成集成开发环境的过程。早期的文本编辑器是被动工具——显示文本,你来编辑。现代 IDE 会主动分析你的代码、在编译前标记错误、建议重构、管理依赖。工具从被动变成了主动。KAIROS 对 AI 编程助手的意义就像这个转变。
但规模差距很大。IDE 的静态分析基于语法和类型系统。一个带记忆整合的守护模式 AI agent 则基于语义、意图和积累的行为模式运作。它不只是知道你的代码能编译通过,而是知道你在试图构建什么。
如果 KAIROS 以接近泄露源代码描述的形态上线,它将是第一个真正作为后台 agent 而非按需助手运行的 AI 编程工具。这个区分很重要——助手在你问的时候帮忙,agent 代你行动。
关于 KAIROS 还有哪些不知道的
尽管泄露源代码中引用量很大,但关键问题仍然没有答案。
⚠️ 什么时候上线。 没有公开时间表。feature flag 是关闭的。内部 flag 可能在代码库中存在数月甚至数年才进入生产环境——也可能永远不会。KAIROS 出现在源代码里不等于它一定会发布。
⚠️ autoDream 的「确定事实」是否可靠。 把试探性观察自动提升为确定性断言是系统中最关键的操作。如果整合过程做了错误的提升——把一个错误的假设当成既定事实——agent 后续的行为都会建立在有问题的基础上。泄露代码中看不到系统如何处理或防止这种失败模式。
⚠️ 常驻监控的隐私问题。 一个持续观察文件变动、终端输出和开发活动的 daemon 会带来严重的隐私疑问。哪些数据传到了 Anthropic 的服务器?哪些在本地处理?监控范围可以配置吗?泄露的源代码没有明确回答这些问题。
⚠️ 持久 daemon 的资源消耗。 把一个大语言模型作为后台进程运行,计算成本不低。泄露代码没有说明 KAIROS 依赖本地推理、持续 API 调用,还是某种混合方案。每种选择对开发者的机器和 Anthropic 的基础设施都有不同的成本和性能影响。
在 Anthropic 正式公布 KAIROS 或独立研究人员对泄露代码进行更彻底的分析之前,这些问题会一直悬着。
延伸阅读
- Claude Code 源代码泄露始末 — 泄露事件全过程和曝光内容
- Claude Code Feature Flag 全盘点 — 44 个未发布功能完整梳理
- 资料库 — 浏览 3 月 26 日泄露的全部文件