Claude Mythos

Claude Mythos 模型對比

拆解 Anthropic「Capybara」家族的演進脈絡——從 Haiku 的輕快到 Mythos 的質變式推理。

info 文檔狀態:官方 + 檔案
「Mythos 不只是堆參數,而是架構層面的範式轉換。」
— Anthropic 內部備忘錄
檔位 01

Haiku

響應快到亞秒級。專為大批量輕任務優化。

CMS 曝光確認
bolt
檔位 02

Sonnet

幹活主力。性能和成本拿捏得剛好,日常夠用。

CMS 曝光確認
auto_awesome
檔位 03

Opus

旗艦推理。多步規劃、深度上下文,硬核場景的首選。

CMS 曝光確認
psychology
檔位 Ω

Mythos

全新 Capybara 檔。SWE-bench 93.9%,USAMO 97.6%,CyberGym 83.1%——全面碾壓 Opus 4.6。

官方確認
炸裂
hub
Claude Mythos capability evaluation summary
官方數據解讀

什麼叫「質變」

4月8日官方發佈證實了一切。Mythos Preview 在 SWE-bench Verified 拿到 93.9%(Opus 4.6 是 80.8%),USAMO 2026 拿到 97.6%(Opus 4.6 只有 42.3%),CyberGym 83.1%。不是定性描述,是實打實的數字。

Claude Mythos 硬指標對比

綜合官方數據和公開資訊,拉出來橫向比一比。

已確認 / 公開
官方確認 / 推測
指標 Haiku Sonnet Opus Mythos(推測)
首 token 延遲 (TTFT) 120ms 450ms 1.2s ~2.5s
上下文視窗 200K 200K 1M+
程式碼能力 Baseline Good Excellent "Dramatically higher"
推理能力 Baseline Good Excellent "Dramatically higher"
網安能力 Strong "Far ahead of any AI"
價格檔位 $1/$5 $3/$15 $5/$25 $25/$125

Claude Mythos 為什麼重要

「從 Opus 到 Mythos,變化不在於餵了多少資料,而在於它開始真正理解這個世界。Mythos 預測的不是下一個 token,而是思維的後果。」

看深度分析 arrow_forward
architecture

一個全新的檔位

Capybara 不是給 Opus 打補丁——它是一個全新層級。更大、更聰明、也更貴。Anthropic 的模型家族從三檔變成了四檔。

speed

網安能力拉滿

Anthropic 內部評價:「網安能力遠超任何其他 AI」。參考資料:Opus 4.6 在沒有特殊工具的情況下就挖出了 500+ 個高危零日漏洞。Mythos 更進一步——在 Frontier Red Team 測試中,90 分鐘內攻破了一個存在 20 年的 Linux 核心漏洞。

verified_user

不急著放出來

Mythos 目前只給少數網安防禦客戶試用。Anthropic 的態度很明確:「效率沒大幅提升之前,不會大範圍開放。」

Claude Mythos 對比答疑

chevron_right

Claude Mythos(Capybara)是 Opus 的升級版嗎?

不是。Capybara 是和 Haiku、Sonnet、Opus 並列的全新檔位,是 Anthropic 模型家族的結構性擴展。

chevron_right

跑 Claude Mythos 貴不貴?

官方定價是 Opus 4.6 的 5 倍:輸入 $25/百萬 token,輸出 $125/百萬 token。目前僅限獲批組織使用。

chevron_right

表裡的 Claude Mythos 資料靠譜嗎?

標了「推測」的資料來自3月洩露文檔的描述性說法。標了「已確認」的來自4月8日官方發佈的數據。

mail

別錯過更新

訂閱 Claude Mythos 情報網,第一時間收到經過核實的發現和重要動態。

不發垃圾郵件,隨時退訂