Imagina una herramienta que no solo escribe correos o analiza hojas de cálculo, sino que es capaz de encontrar grietas en los sistemas de seguridad más robustos del mundo (como Firefox o sistemas operativos modernos) antes incluso de que sus creadores sepan que existen. No es ciencia ficción: es Project Glasswing, el último experimento controlado de Anthropic que ha dejado a la industria con la boca abierta.

Qué ha pasado

Anthropic ha publicado los resultados de las pruebas de su nuevo modelo, Claude Mythos Preview, y las cifras son, cuanto menos, impactantes. En un entorno de pruebas llamado CyberGym, mientras que el modelo más potente hasta la fecha (Claude Opus 4.6) alcanzaba un 66%, el nuevo Mythos ha llegado al 83.1%.

Pero lo que realmente ha encendido las alarmas (positivas y negativas) es su capacidad para crear exploits: en el benchmark de Firefox 147, Mythos fue capaz de desarrollar 181 exploits funcionales, frente a los ridículos 2 que logró su predecesor. Estamos hablando de una mejora de 90 veces en capacidad ofensiva y técnica.

Lo importante (en 30 segundos)

* Salto generacional: Mythos supera en casi un 25% la capacidad de resolución de problemas de software (SWE-bench Pro).
Cero días de tregua: Es capaz de descubrir vulnerabilidades zero-day* (fallos desconocidos para el fabricante) de forma autónoma.
* Acceso restringido: Debido a su peligrosidad si cae en malas manos, solo 12 socios estratégicos (como Apple o Microsoft) tienen acceso.
* Hardware al límite: Simultáneamente, las pruebas en local (gracias a tarjetas como la RTX 5090) confirman que los modelos abiertos como Qwen están empezando a pisar los talones a los gigantes comerciales.

Qué significa para empresas

¿Por qué debería importarle esto a una PYME en Logroño o Madrid? Básicamente, porque el tablero de juego acaba de cambiar.

Seguridad proactiva: La IA ya no solo sirve para crear un [chatbot] o automatizar tareas; pronto será el escudo principal de las empresas. Una [aplicación a medida] conectada a sistemas como Mythos podría encontrar agujeros de seguridad en tu propia web antes que un hacker.

Cuidado con el código: Si tu equipo usa IA para programar, modelos como este garantizan un código mucho más limpio y libre de errores críticos.

Democratización del hardware: Los benchmarks con la nueva RTX 5090 demuestran que ya no hace falta ser Google para mover modelos potentes. La potencia de cálculo está llegando a las oficinas físicas.

Recomendación VarkIA

En VarkIA siempre decimos que la IA es una carrera de fondo. Aunque Mythos aún no esté disponible para el público general por seguridad, esto nos indica que la capacidad de razonamiento técnico de estos sistemas está explotando.

Nuestra recomendación es clara: Empieza hoy con la base. Si aún no tienes una [integración] sólida de IA en tus procesos o no has explorado la [automatización de WhatsApp] para tu atención al cliente, estás perdiendo el entrenamiento necesario para cuando estas herramientas de hiper-seguridad y razonamiento avanzado lleguen a tu sector.

No esperes a que el futuro sea obligatorio; haz que sea tu ventaja competitiva.

---

Fuentes

* nxcode.io: Project Glasswing
* Jornal 24 Horas: IA de Anthropic crea exploits
* Akita on Rails: Testando LLMs con RTX 5090

Claude Mythos: El salto de gigante en ciberseguridad que Anthropic prefiere mantener bajo llave

Qué ha pasado

Lo importante (en 30 segundos)

Qué significa para empresas

Recomendación VarkIA

Fuentes

Newsletter de IA para empresas

Servicios relacionados

Plataformas a Medida con IA: tu Web App y App Móvil con IA Integrada

Chatbot IA para Empresas: Chatbot WhatsApp, Web y Atención al Cliente

Páginas Web con Chatbot Inteligente Integrado