Claude Mythos モデル比較
Anthropic「Capybara」ラインの全貌を読み解く。Haikuの軽快さからMythosの異次元の推論力まで。
— 流出した社内メモ
Haiku
サブ秒応答。大量の軽いタスクをさばくのに特化。
Sonnet
現場の主力。性能とコストのバランスがちょうどいい。
Opus
フラッグシップの推論力。複雑な多段階タスクに強い。
Mythos
新設Capybaraティア。SWE-bench 93.9%、USAMO 97.6%、CyberGym 83.1%——Opus 4.6を全面的に圧倒。
「質的飛躍」とは何か
4月8日の公式発表ですべてが確認された。Mythos PreviewはSWE-bench Verifiedで93.9%(Opus 4.6は80.8%)、USAMO 2026で97.6%(Opus 4.6は42.3%)、CyberGym 83.1%。定性的な表現ではない——実数だ。
Claude Mythos スペック比較
流出技術文書と公開情報を突き合わせて、横並びで比べてみた。
| 指標 | Haiku | Sonnet | Opus | Mythos(推測) |
|---|---|---|---|---|
| 初回応答 (TTFT) | 120ms | 450ms | 1.2s | ~2.5s |
| コンテキスト長 | 200K | 200K | 1M+ | — |
| コーディング力 | Baseline | Good | Excellent | "Dramatically higher" |
| 推論力 | Baseline | Good | Excellent | "Dramatically higher" |
| セキュリティ | — | — | Strong | "Far ahead of any AI" |
| コスト帯 | $1/$5 | $3/$15 | $5/$25 | $25/$125 |
Claude Mythosはなぜ重要か
「OpusからMythosへの変化は、データ量の話じゃない。世界の理解そのものが深くなった。Mythosは次のトークンじゃなく、思考の結末を予測する。」
詳しく見る arrow_forwardまったく新しいティア
CapybaraはOpusのマイナーチェンジじゃない。より大きく、より賢く、より高い——Anthropicのモデル体系に新しい格が加わった。
セキュリティ能力が桁違い
Anthropic社内の評価:「サイバー能力であらゆるAIモデルをはるかに凌駕する」。参考までに、Opus 4.6は特別なツールなしで本番コードから500件以上の高リスクゼロデイを発見済み。MythosはFrontier Red Teamテストで、20年間潜んでいたLinuxカーネルの脆弱性を90分で突破した。
急いで出す気はない
当面は少数のセキュリティ防衛系クライアントだけに限定公開。Anthropicの姿勢は明確:「効率を大幅に上げないと一般公開はしない」。
Claude Mythos 比較Q&A
chevron_right Claude Mythos(Capybara)はOpusのアップグレード?
違います。Haiku、Sonnet、Opusに並ぶ新設ティアです。Opusのアップデートではなく、モデル体系そのものの拡張。
chevron_right Claude Mythosの運用コストは?
流出文書には「非常に高コスト」とだけ。具体的な価格は出ていません。Anthropicは「効率が劇的に上がるまで一般公開しない」と言っています。
chevron_right Claude Mythosの数値は信頼できる?
「推測」マーク付きのデータは流出文書の定性的な記述がベースで、精密なベンチマークスコアではありません。確認済みデータは公式情報から取っています。
最新情報を受け取る
Claude Mythos情報ネットワークに登録。検証済みの発見や重要アップデートを直接お届けします。
スパムは送りません。いつでも解除OK