Claude Mythos 模型对比

拆解 Anthropic「Capybara」家族的演进脉络——从 Haiku 的轻快到 Mythos 的质变式推理。

info 文档状态：官方 + 档案

「Mythos 不只是堆参数，而是架构层面的范式转换。」
— Anthropic 内部备忘录

档位 01

Haiku

响应快到亚秒级。专为大批量轻任务优化。

CMS 曝光确认

快

bolt

档位 02

Sonnet

干活主力。性能和成本拿捏得刚好，日常够用。

CMS 曝光确认

稳

auto_awesome

档位 03

Opus

旗舰推理。多步规划、深度上下文，硬核场景的首选。

CMS 曝光确认

强

psychology

档位 Ω

Mythos

全新 Capybara 档。SWE-bench 93.9%，USAMO 97.6%，CyberGym 83.1%——全面碾压 Opus 4.6。

官方确认

炸裂

hub

Claude Mythos capability evaluation summary

官方数据解读

什么叫「质变」

4月8日官方发布证实了一切。Mythos Preview 在 SWE-bench Verified 拿到 93.9%（Opus 4.6 是 80.8%），USAMO 2026 拿到 97.6%（Opus 4.6 只有 42.3%），CyberGym 83.1%。不是定性描述，是实打实的数字。

Claude Mythos 硬指标对比

综合官方数据和公开信息，拉出来横向比一比。

已确认 / 公开

官方确认 / 推测

指标	Haiku	Sonnet	Opus	Mythos（推测）
首 token 延迟 (TTFT)	120ms	450ms	1.2s	~2.5s
上下文窗口	200K	200K	1M+	—
代码能力	Baseline	Good	Excellent	"Dramatically higher"
推理能力	Baseline	Good	Excellent	"Dramatically higher"
网安能力	—	—	Strong	"Far ahead of any AI"
价格档位	$1/$5	$3/$15	$5/$25	$25/$125

Claude Mythos 为什么重要

「从 Opus 到 Mythos，变化不在于喂了多少数据，而在于它开始真正理解这个世界。Mythos 预测的不是下一个 token，而是思维的后果。」

看深度分析 arrow_forward

architecture

一个全新的档位

Capybara 不是给 Opus 打补丁——它是一个全新层级。更大、更聪明、也更贵。Anthropic 的模型家族从三档变成了四档。

speed

网安能力拉满

Anthropic 内部评价：「网安能力远超任何其他 AI」。参考数据：Opus 4.6 在没有特殊工具的情况下就挖出了 500+ 个高危零日漏洞。Mythos 更进一步——在 Frontier Red Team 测试中，90 分钟内攻破了一个存在 20 年的 Linux 内核漏洞。

verified_user

不急着放出来

Mythos 目前只给少数网安防御客户试用。Anthropic 的态度很明确：「效率没大幅提升之前，不会大范围开放。」

Claude Mythos 对比答疑

chevron_right

Claude Mythos（Capybara）是 Opus 的升级版吗？

不是。Capybara 是和 Haiku、Sonnet、Opus 并列的全新档位，是 Anthropic 模型家族的结构性扩展。

chevron_right

跑 Claude Mythos 贵不贵？

官方定价是 Opus 4.6 的 5 倍：输入 $25/百万 token，输出 $125/百万 token。目前仅限获批组织使用。

chevron_right

表里的 Claude Mythos 数据靠谱吗？

标了「推测」的数据来自3月泄露文档的描述性说法。标了「已确认」的来自4月8日官方发布的数据。

查看全部问题

Claude Mythos 模型对比

Haiku

Sonnet

Opus

Mythos

什么叫「质变」

Claude Mythos 硬指标对比

Claude Mythos 为什么重要

一个全新的档位

网安能力拉满

不急着放出来

Claude Mythos 对比答疑

Claude Mythos（Capybara）是 Opus 的升级版吗？

跑 Claude Mythos 贵不贵？

表里的 Claude Mythos 数据靠谱吗？

别错过更新