Claude Mythos 모델 비교
Anthropic 'Capybara' 라인의 전체 그림. Haiku의 가벼움부터 Mythos의 차원이 다른 추론력까지.
— Anthropic 내부 메모
Haiku
1초 미만 응답. 대량의 가벼운 작업을 빠르게 처리.
Sonnet
실전 주력. 성능과 비용의 균형이 딱 맞는 모델.
Opus
플래그십 추론. 복잡한 다단계 문제와 깊은 맥락 파악에 강함.
Mythos
새로 생긴 Capybara 등급. SWE-bench 93.9%, USAMO 97.6%, CyberGym 83.1% — 모든 벤치마크에서 Opus 4.6 압도.
'질적 변화'란 무엇인가
4월 8일 공식 발표로 모든 것이 확인됐습니다. Mythos Preview는 SWE-bench Verified 93.9%(Opus 4.6: 80.8%), USAMO 2026 97.6%(Opus 4.6: 42.3%), CyberGym 83.1%를 기록했습니다. 정성적 주장이 아닌 실제 수치입니다.
Claude Mythos 스펙 비교
공식 벤치마크와 공개 정보를 맞대어 나란히 비교했습니다.
| 지표 | Haiku | Sonnet | Opus | Mythos (추측) |
|---|---|---|---|---|
| 첫 응답 (TTFT) | 120ms | 450ms | 1.2s | ~2.5s |
| 컨텍스트 길이 | 200K | 200K | 1M+ | — |
| 코딩 능력 | Baseline | Good | Excellent | "Dramatically higher" |
| 추론 능력 | Baseline | Good | Excellent | "Dramatically higher" |
| 보안 능력 | — | — | Strong | "Far ahead of any AI" |
| 가격대 | $1/$5 | $3/$15 | $5/$25 | $25/$125 |
Claude Mythos가 중요한 이유
'Opus에서 Mythos로의 변화는 데이터를 더 많이 넣어서가 아니다. 세상을 이해하는 방식 자체가 달라졌다. Mythos는 다음 토큰이 아니라 사고의 결말을 예측한다.'
자세히 보기 arrow_forward완전히 새로운 등급
Capybara는 Opus의 패치가 아닙니다. 더 크고, 더 똑똑하고, 더 비싼——Anthropic 모델 체계에 새 등급이 추가된 겁니다.
보안 능력이 차원이 다름
Anthropic 내부 평가: '사이버 역량에서 다른 모든 AI 모델을 훨씬 앞선다.' 참고로 Opus 4.6도 특별한 도구 없이 프로덕션 코드에서 500건 이상의 고위험 제로데이를 발견했습니다. Mythos는 한 단계 더 나아가 Frontier Red Team 테스트에서 20년 된 Linux 커널 취약점을 90분 만에 공략했습니다.
서두르지 않는 출시
지금은 보안 방어 전문가한테만 한정 공개. Anthropic의 입장: '효율을 획기적으로 올리기 전에는 일반에 내놓지 않겠다.'
Claude Mythos 비교 Q&A
chevron_right Claude Mythos(Capybara)는 Opus의 업그레이드인가요?
아닙니다. Haiku, Sonnet, Opus와 나란히 존재하는 새 등급이에요. Opus를 업데이트한 게 아니라 모델 체계 자체를 확장한 겁니다.
chevron_right Claude Mythos 돌리는 데 얼마나 드나요?
공식 가격은 Opus 4.6의 5배: 입력 $25/백만 토큰, 출력 $125/백만 토큰. 현재 승인된 조직만 접근 가능합니다.
chevron_right Claude Mythos 수치 믿어도 되나요?
'추측' 표시가 된 건 3월 유출 문서의 서술적 표현 기반. '확인' 표시된 건 4월 8일 공식 발표 데이터예요.
새 소식 받기
Claude Mythos 정보망에 등록하세요. 검증된 발견과 중요 업데이트를 바로 전해드립니다.
스팸 안 보냅니다. 언제든 해지 가능