Claude Mythos 模型对比
拆解 Anthropic「Capybara」家族的演进脉络——从 Haiku 的轻快到 Mythos 的质变式推理。
— Anthropic 内部备忘录
Haiku
响应快到亚秒级。专为大批量轻任务优化。
Sonnet
干活主力。性能和成本拿捏得刚好,日常够用。
Opus
旗舰推理。多步规划、深度上下文,硬核场景的首选。
Mythos
全新 Capybara 档。SWE-bench 93.9%,USAMO 97.6%,CyberGym 83.1%——全面碾压 Opus 4.6。
什么叫「质变」
4月8日官方发布证实了一切。Mythos Preview 在 SWE-bench Verified 拿到 93.9%(Opus 4.6 是 80.8%),USAMO 2026 拿到 97.6%(Opus 4.6 只有 42.3%),CyberGym 83.1%。不是定性描述,是实打实的数字。
Claude Mythos 硬指标对比
综合官方数据和公开信息,拉出来横向比一比。
| 指标 | Haiku | Sonnet | Opus | Mythos(推测) |
|---|---|---|---|---|
| 首 token 延迟 (TTFT) | 120ms | 450ms | 1.2s | ~2.5s |
| 上下文窗口 | 200K | 200K | 1M+ | — |
| 代码能力 | Baseline | Good | Excellent | "Dramatically higher" |
| 推理能力 | Baseline | Good | Excellent | "Dramatically higher" |
| 网安能力 | — | — | Strong | "Far ahead of any AI" |
| 价格档位 | $1/$5 | $3/$15 | $5/$25 | $25/$125 |
Claude Mythos 为什么重要
「从 Opus 到 Mythos,变化不在于喂了多少数据,而在于它开始真正理解这个世界。Mythos 预测的不是下一个 token,而是思维的后果。」
看深度分析 arrow_forward一个全新的档位
Capybara 不是给 Opus 打补丁——它是一个全新层级。更大、更聪明、也更贵。Anthropic 的模型家族从三档变成了四档。
网安能力拉满
Anthropic 内部评价:「网安能力远超任何其他 AI」。参考数据:Opus 4.6 在没有特殊工具的情况下就挖出了 500+ 个高危零日漏洞。Mythos 更进一步——在 Frontier Red Team 测试中,90 分钟内攻破了一个存在 20 年的 Linux 内核漏洞。
不急着放出来
Mythos 目前只给少数网安防御客户试用。Anthropic 的态度很明确:「效率没大幅提升之前,不会大范围开放。」
Claude Mythos 对比答疑
chevron_right Claude Mythos(Capybara)是 Opus 的升级版吗?
不是。Capybara 是和 Haiku、Sonnet、Opus 并列的全新档位,是 Anthropic 模型家族的结构性扩展。
chevron_right 跑 Claude Mythos 贵不贵?
官方定价是 Opus 4.6 的 5 倍:输入 $25/百万 token,输出 $125/百万 token。目前仅限获批组织使用。
chevron_right 表里的 Claude Mythos 数据靠谱吗?
标了「推测」的数据来自3月泄露文档的描述性说法。标了「已确认」的来自4月8日官方发布的数据。
别错过更新
订阅 Claude Mythos 情报网,第一时间收到经过核实的发现和重要动态。
不发垃圾邮件,随时退订