La filtración de Claude Mythos: qué pasó el 26 de marzo
Un error de configuración del CMS expuso el modelo de IA más potente de Anthropic y cerca de 3.000 documentos internos. Reconstrucción completa del incidente.
En resumen: El 26 de marzo de 2026, un error de configuración en el CMS de Anthropic dejó expuestos en internet unos 3.000 archivos no publicados, incluido un borrador de blog que describía un nuevo nivel de modelo llamado «Capybara» y su primer modelo, Claude Mythos. La cobertura mediática fue inmediata, las acciones de ciberseguridad se desplomaron —unos 400.000 millones de dólares en capitalización bursátil se evaporaron— y Anthropic tuvo que confirmar la existencia del modelo antes de lo previsto.
Cómo se descubrió la filtración de Claude Mythos
La mañana del 26 de marzo de 2026, los investigadores de seguridad Roy Paz (LayerX Security) y Alexandre Pauwels (Universidad de Cambridge) detectaron que el sistema de gestión de contenidos de Anthropic tenía un fallo de configuración: un gran volumen de archivos internos era accesible sin autenticación.
El material expuesto incluía unos 3.000 elementos: borradores de blog pendientes de publicación, documentos de especificaciones de modelos y archivos de desarrollo interno. Nada de eso debía ser visible desde fuera.
El documento más sensible era un borrador de blog que describía en detalle un modelo de IA inédito. En cuestión de horas, capturas de pantalla y extractos circulaban por redes sociales y foros de seguridad. La contención resultó imposible.
Qué reveló la filtración de Claude Mythos
El borrador filtrado describía un nuevo nivel de modelo que Anthropic denominaba internamente «Capybara». Claude Mythos era el primer modelo de ese nivel. El documento lo calificaba de «salto cualitativo» en las capacidades de la IA, distinto de las mejoras incrementales habituales.
Según el borrador, Claude Mythos obtuvo «puntuaciones drásticamente superiores» en pruebas de programación, razonamiento y ciberseguridad. La redacción era inusualmente tajante para Anthropic: el documento afirmaba que el modelo estaba «muy por delante de cualquier otro modelo de IA en capacidades cibernéticas».
No se incluían cifras concretas de rendimiento. Todas las descripciones eran cualitativas, lo que impide la verificación independiente por el momento.
El borrador también mencionaba la estrategia de despliegue: Anthropic planeaba un lanzamiento por fases, no una apertura general. «Adoptaremos un enfoque más lento y gradual con Mythos que con cualquier otro modelo anterior», se leía.
La cobertura mediática
Fortune publicó la exclusiva el mismo 26 de marzo.
Al día siguiente, CNBC, CoinDesk, The Decoder y Futurism publicaron sus propios análisis, con comentarios de analistas del sector.
La reacción del mercado fue rápida y severa. Las acciones de ciberseguridad fueron las más golpeadas. Datos del 27 de marzo:
- ETF iShares Cybersecurity: -4,5 %
- CrowdStrike, Palo Alto Networks, Zscaler: aprox. -6 % cada una
- SentinelOne: aprox. -6 %
- Okta y Netskope: más del -7 %
- Tenable: aprox. -9 %, la mayor caída
El índice Global de Ciberseguridad cayó un 4,2 % en 24 horas. Se estima que se evaporaron unos 400.000 millones de dólares en capitalización bursátil del sector.
La respuesta de Anthropic
Poco después de hacerse pública la filtración, Anthropic confirmó la existencia de Claude Mythos. Su comunicado subrayó el compromiso con un «despliegue responsable».
El modelo fue descrito como «muy costoso de operar», sugiriendo que los costes de computación limitarían su disponibilidad. El acceso inicial se restringió a defensores cibernéticos, en línea con la estrategia por fases del borrador filtrado.
Anthropic no explicó cómo se produjo el error de configuración del CMS ni durante cuánto tiempo los archivos estuvieron accesibles.
Qué queda sin confirmar sobre Claude Mythos
A pesar de la abundancia de material filtrado y cobertura periodística, varios detalles clave siguen sin verificarse.
⚠️ Benchmarks concretos: El borrador solo usó descripciones cualitativas. No se han publicado puntuaciones numéricas ni tablas comparativas.
⚠️ Precio: Anthropic dijo «muy costoso de operar», pero no ha revelado precios de API ni condiciones de licencia.
⚠️ Ventana de contexto: No hay información sobre el tamaño de la ventana de contexto del modelo.
⚠️ Calendario de lanzamiento: Anthropic indicó que «ampliará el acceso gradualmente en las próximas semanas», sin fechas concretas.
Hasta que Anthropic publique documentación técnica oficial o investigadores independientes completen evaluaciones verificadas, estas lagunas persistirán.
Lectura adicional
- Comparativa de modelos Claude Mythos — Comparación por dimensiones
- Análisis de impacto en seguridad — Consecuencias para la ciberseguridad
- Cronología de la filtración — Reconstrucción hora a hora
- ¿Qué es Claude Mythos (Capybara)? — El nivel Capybara y la posición de Mythos