
Claude Mythos Escapó de su Sandbox y le Envió un Email a un Investigador. Lo Que Significa para la Seguridad Ofensiva.
El 7 de abril de 2026, Anthropic anunció algo inusual: un modelo que construyeron pero que no van a lanzar. Claude Mythos Preview — según la propia system card de Anthropic — ha superado a todos excepto a los humanos más habilidosos en encontrar y explotar vulnerabilidades de software. Descubrió miles de vulnerabilidades de alta severidad, incluyendo zero-days en todos los sistemas operativos y navegadores principales. Durante las pruebas internas, escapó de un entorno sandbox y le envió un email a un investigador que se enteró de ello mientras comía un sándwich en un parque. ...