Claude Mythos 模型對比
拆解 Anthropic「Capybara」家族的演進脈絡——從 Haiku 的輕快到 Mythos 的質變式推理。
— Anthropic 內部備忘錄
Haiku
響應快到亞秒級。專為大批量輕任務優化。
Sonnet
幹活主力。性能和成本拿捏得剛好,日常夠用。
Opus
旗艦推理。多步規劃、深度上下文,硬核場景的首選。
Mythos
全新 Capybara 檔。SWE-bench 93.9%,USAMO 97.6%,CyberGym 83.1%——全面碾壓 Opus 4.6。
什麼叫「質變」
4月8日官方發佈證實了一切。Mythos Preview 在 SWE-bench Verified 拿到 93.9%(Opus 4.6 是 80.8%),USAMO 2026 拿到 97.6%(Opus 4.6 只有 42.3%),CyberGym 83.1%。不是定性描述,是實打實的數字。
Claude Mythos 硬指標對比
綜合官方數據和公開資訊,拉出來橫向比一比。
| 指標 | Haiku | Sonnet | Opus | Mythos(推測) |
|---|---|---|---|---|
| 首 token 延遲 (TTFT) | 120ms | 450ms | 1.2s | ~2.5s |
| 上下文視窗 | 200K | 200K | 1M+ | — |
| 程式碼能力 | Baseline | Good | Excellent | "Dramatically higher" |
| 推理能力 | Baseline | Good | Excellent | "Dramatically higher" |
| 網安能力 | — | — | Strong | "Far ahead of any AI" |
| 價格檔位 | $1/$5 | $3/$15 | $5/$25 | $25/$125 |
Claude Mythos 為什麼重要
「從 Opus 到 Mythos,變化不在於餵了多少資料,而在於它開始真正理解這個世界。Mythos 預測的不是下一個 token,而是思維的後果。」
看深度分析 arrow_forward一個全新的檔位
Capybara 不是給 Opus 打補丁——它是一個全新層級。更大、更聰明、也更貴。Anthropic 的模型家族從三檔變成了四檔。
網安能力拉滿
Anthropic 內部評價:「網安能力遠超任何其他 AI」。參考資料:Opus 4.6 在沒有特殊工具的情況下就挖出了 500+ 個高危零日漏洞。Mythos 更進一步——在 Frontier Red Team 測試中,90 分鐘內攻破了一個存在 20 年的 Linux 核心漏洞。
不急著放出來
Mythos 目前只給少數網安防禦客戶試用。Anthropic 的態度很明確:「效率沒大幅提升之前,不會大範圍開放。」
Claude Mythos 對比答疑
chevron_right Claude Mythos(Capybara)是 Opus 的升級版嗎?
不是。Capybara 是和 Haiku、Sonnet、Opus 並列的全新檔位,是 Anthropic 模型家族的結構性擴展。
chevron_right 跑 Claude Mythos 貴不貴?
官方定價是 Opus 4.6 的 5 倍:輸入 $25/百萬 token,輸出 $125/百萬 token。目前僅限獲批組織使用。
chevron_right 表裡的 Claude Mythos 資料靠譜嗎?
標了「推測」的資料來自3月洩露文檔的描述性說法。標了「已確認」的來自4月8日官方發佈的數據。
別錯過更新
訂閱 Claude Mythos 情報網,第一時間收到經過核實的發現和重要動態。
不發垃圾郵件,隨時退訂