Claude Mythos

Claude Mythos 模型对比

拆解 Anthropic「Capybara」家族的演进脉络——从 Haiku 的轻快到 Mythos 的质变式推理。

info 文档状态:官方 + 档案
「Mythos 不只是堆参数,而是架构层面的范式转换。」
— Anthropic 内部备忘录
档位 01

Haiku

响应快到亚秒级。专为大批量轻任务优化。

CMS 曝光确认
bolt
档位 02

Sonnet

干活主力。性能和成本拿捏得刚好,日常够用。

CMS 曝光确认
auto_awesome
档位 03

Opus

旗舰推理。多步规划、深度上下文,硬核场景的首选。

CMS 曝光确认
psychology
档位 Ω

Mythos

全新 Capybara 档。SWE-bench 93.9%,USAMO 97.6%,CyberGym 83.1%——全面碾压 Opus 4.6。

官方确认
炸裂
hub
Claude Mythos capability evaluation summary
官方数据解读

什么叫「质变」

4月8日官方发布证实了一切。Mythos Preview 在 SWE-bench Verified 拿到 93.9%(Opus 4.6 是 80.8%),USAMO 2026 拿到 97.6%(Opus 4.6 只有 42.3%),CyberGym 83.1%。不是定性描述,是实打实的数字。

Claude Mythos 硬指标对比

综合官方数据和公开信息,拉出来横向比一比。

已确认 / 公开
官方确认 / 推测
指标 Haiku Sonnet Opus Mythos(推测)
首 token 延迟 (TTFT) 120ms 450ms 1.2s ~2.5s
上下文窗口 200K 200K 1M+
代码能力 Baseline Good Excellent "Dramatically higher"
推理能力 Baseline Good Excellent "Dramatically higher"
网安能力 Strong "Far ahead of any AI"
价格档位 $1/$5 $3/$15 $5/$25 $25/$125

Claude Mythos 为什么重要

「从 Opus 到 Mythos,变化不在于喂了多少数据,而在于它开始真正理解这个世界。Mythos 预测的不是下一个 token,而是思维的后果。」

看深度分析 arrow_forward
architecture

一个全新的档位

Capybara 不是给 Opus 打补丁——它是一个全新层级。更大、更聪明、也更贵。Anthropic 的模型家族从三档变成了四档。

speed

网安能力拉满

Anthropic 内部评价:「网安能力远超任何其他 AI」。参考数据:Opus 4.6 在没有特殊工具的情况下就挖出了 500+ 个高危零日漏洞。Mythos 更进一步——在 Frontier Red Team 测试中,90 分钟内攻破了一个存在 20 年的 Linux 内核漏洞。

verified_user

不急着放出来

Mythos 目前只给少数网安防御客户试用。Anthropic 的态度很明确:「效率没大幅提升之前,不会大范围开放。」

Claude Mythos 对比答疑

chevron_right

Claude Mythos(Capybara)是 Opus 的升级版吗?

不是。Capybara 是和 Haiku、Sonnet、Opus 并列的全新档位,是 Anthropic 模型家族的结构性扩展。

chevron_right

跑 Claude Mythos 贵不贵?

官方定价是 Opus 4.6 的 5 倍:输入 $25/百万 token,输出 $125/百万 token。目前仅限获批组织使用。

chevron_right

表里的 Claude Mythos 数据靠谱吗?

标了「推测」的数据来自3月泄露文档的描述性说法。标了「已确认」的来自4月8日官方发布的数据。

mail

别错过更新

订阅 Claude Mythos 情报网,第一时间收到经过核实的发现和重要动态。

不发垃圾邮件,随时退订