El gobierno de Estados Unidos ha tomado una medida drástica al ordenar a Anthropic la suspensión inmediata del acceso extranjero a sus dos modelos de inteligencia artificial más avanzados, Fable 5 y Mythos 5. Esta decisión, anunciada el pasado viernes por el Secretario de Comercio, Howard Lutnick, se basa en preocupaciones de seguridad nacional relacionadas con una supuesta técnica que permitiría eludir las restricciones de seguridad integradas en dichos modelos.
La directiva, enviada en forma de carta a Dario Amodei, CEO de Anthropic, establece controles de exportación que impiden el uso de estos modelos por parte de ciudadanos extranjeros, tanto dentro como fuera de Estados Unidos. La magnitud de estas restricciones es tal que afecta incluso a empleados de Anthropic que son extranjeros, lo que llevó a la empresa a desactivar los modelos el viernes por la tarde para asegurar el cumplimiento de la orden. Sin embargo, el acceso a otros modelos de inteligencia artificial de la compañía no se vio afectado.
Fable 5 y Mythos 5 fueron lanzados a principios de semana, siendo descritos por Anthropic como los sistemas más capaces que han desplegado hasta la fecha. Mythos 5 estaba disponible para los miembros del Proyecto Glasswing, una iniciativa que permitía a empresas seleccionadas de ciberseguridad utilizar el modelo para identificar y abordar vulnerabilidades. No está claro cómo afectará esta acción del Departamento de Comercio al Proyecto Glasswing, y Anthropic no ha respondido a solicitudes de comentarios.
La carta del Departamento de Comercio no especificó el tipo de preocupación de seguridad nacional que motivó la acción. Sin embargo, en un comunicado publicado el viernes por la noche, Anthropic afirmó que su comprensión es que el gobierno había tomado conocimiento de una técnica para “jailbreaking” de Fable 5, término que se refiere a métodos que eluden las salvaguardias integradas de un modelo. Según la empresa, el gobierno proporcionó solo evidencia verbal de lo que describió como un “jailbreak estrecho y no universal”, que consistía en incitar al modelo a leer un código específico e identificar fallos en el software.
Anthropic ha cuestionado la gravedad de este hallazgo. La compañía revisó un informe que, según cree, sirvió de base para la directiva gubernamental y encontró que las capacidades demostradas ya estaban disponibles en otros modelos accesibles públicamente, incluido el GPT-5.5 de OpenAI. La empresa también destacó que esas mismas capacidades son utilizadas habitualmente por profesionales de ciberseguridad para fines defensivos.
Katie Moussouris, CEO de la firma de ciberseguridad Luta Security, comentó en BlueSky que el problema deriva de lo que se denomina “Defensa Orientada por Prompts”, un método de ingeniería de instrucciones para sistemas de IA que prioriza la seguridad y trata el lenguaje natural como código. Otros informes han sugerido que Amazon fue responsable de señalar los problemas de seguridad en el modelo, aunque la empresa no ha respondido a las solicitudes de comentarios de CyberScoop.
Anthropic admitió en su declaración que lograr una resistencia perfecta al jailbreak no es alcanzable para ningún proveedor de modelos y afirmó haber diseñado Fable 5 en torno a una estrategia de “defensa en profundidad”, combinando una resistencia estrecha al jailbreak con un monitoreo activo. Además, la compañía sostuvo que ningún evaluador había encontrado un jailbreak universal capaz de eludir ampliamente las salvaguardias del modelo.
La empresa expresó: “No estamos de acuerdo en que el hallazgo de un posible jailbreak estrecho deba ser motivo para retirar un modelo comercial desplegado para cientos de millones de personas. Si este estándar se aplicara en toda la industria, creemos que detendría prácticamente todos los nuevos despliegues de modelos por parte de todos los proveedores de modelos de frontera”.
Esta directiva representa el último capítulo de una prolongada disputa entre Anthropic y la administración de Donald Trump. En febrero, el entonces presidente Trump intentó prohibir los productos de Anthropic en agencias federales después de que la compañía solicitara restricciones más estrictas sobre la utilización de su tecnología por parte del Pentágono. A pesar de esto, cuando Anthropic lanzó Mythos bajo el Proyecto Glasswing, la Agencia de Seguridad Nacional (NSA) recibió Mythos 5 para llevar a cabo operaciones cibernéticas ofensivas. A principios de este mes, Trump firmó una orden ejecutiva que instruía a las agencias federales a reforzar las defensas cibernéticas y a establecer un mecanismo voluntario para que el gobierno tuviera acceso anticipado a modelos de IA poderosos antes de su despliegue.
La justificación expuesta por la administración para la acción del viernes ha suscitado un amplio escepticismo entre investigadores y analistas. Dean Ball, investigador senior en la Fundación para la Innovación Americana, calificó la medida de “incomprensible”. Chris McGuire, investigador senior en el Consejo de Relaciones Exteriores, opinó que los controles de exportación específicos sobre el acceso a modelos podrían ser una herramienta de política legítima, pero consideró altamente cuestionable la restricción general y describió las provisiones de exportación consideradas —que restringen a los ciudadanos extranjeros dentro de EE.UU.— como “absurdas”.
Las implicaciones más amplias para la industria de la inteligencia artificial siguen siendo inciertas. Aaron Levie, CEO de Box, describió la directiva como “un gran punto de inflexión para la regulación de la IA”, argumentando que la disposición del gobierno de considerar ciertos modelos demasiado poderosos para ciertos usos establece un precedente que podría tener consecuencias de gran alcance. Otros líderes tecnológicos en el gobierno apoyaron la acción.
Kirsten Davies, CIO del Departamento de Defensa, escribió en una publicación en X: “Apoyamos plenamente al @POTUS y al @SecWar en la priorización de la seguridad nacional y la seguridad de nuestros combatientes, socios del DIB, infraestructura crítica, socios internacionales y aliados. Algunas cosas son simplemente más importantes que los ciclos de ingresos, el clickbait y la valoración previa a la salida a bolsa. América primero. Siempre”. Anthropic ha declarado que cree que la situación se debe a un malentendido y está trabajando para restaurar el acceso lo antes posible.
La noticia sobre la desactivación de nuevos modelos por parte de Anthropic tras la calificación del gobierno como preocupación de seguridad nacional representa un momento crucial en la intersección de la tecnología, la regulación y la seguridad.