🛡 VULNERABILIDADES 🛡

Anthropic desactiva nuevos modelos tras advertencia gubernamental sobre seguridad nacional.

🛡CyberObservatorio
Idioma

Anthropic desactiva nuevos modelos tras advertencia gubernamental sobre seguridad nacional.

Fuente: CyberScoop

El gobierno de Estados Unidos ha tomado una medida drástica al ordenar a Anthropic la suspensión inmediata del acceso extranjero a sus dos modelos de inteligencia artificial más avanzados, Fable 5 y Mythos 5. Esta decisión, anunciada el pasado viernes por el Secretario de Comercio, Howard Lutnick, se basa en preocupaciones de seguridad nacional relacionadas con una supuesta técnica que permitiría eludir las restricciones de seguridad integradas en dichos modelos.

La directiva, enviada en forma de carta a Dario Amodei, CEO de Anthropic, establece controles de exportación que impiden el uso de estos modelos por parte de ciudadanos extranjeros, tanto dentro como fuera de Estados Unidos. La magnitud de estas restricciones es tal que afecta incluso a empleados de Anthropic que son extranjeros, lo que llevó a la empresa a desactivar los modelos el viernes por la tarde para asegurar el cumplimiento de la orden. Sin embargo, el acceso a otros modelos de inteligencia artificial de la compañía no se vio afectado.

Fable 5 y Mythos 5 fueron lanzados a principios de semana, siendo descritos por Anthropic como los sistemas más capaces que han desplegado hasta la fecha. Mythos 5 estaba disponible para los miembros del Proyecto Glasswing, una iniciativa que permitía a empresas seleccionadas de ciberseguridad utilizar el modelo para identificar y abordar vulnerabilidades. No está claro cómo afectará esta acción del Departamento de Comercio al Proyecto Glasswing, y Anthropic no ha respondido a solicitudes de comentarios.

La carta del Departamento de Comercio no especificó el tipo de preocupación de seguridad nacional que motivó la acción. Sin embargo, en un comunicado publicado el viernes por la noche, Anthropic afirmó que su comprensión es que el gobierno había tomado conocimiento de una técnica para “jailbreaking” de Fable 5, término que se refiere a métodos que eluden las salvaguardias integradas de un modelo. Según la empresa, el gobierno proporcionó solo evidencia verbal de lo que describió como un “jailbreak estrecho y no universal”, que consistía en incitar al modelo a leer un código específico e identificar fallos en el software.

Anthropic ha cuestionado la gravedad de este hallazgo. La compañía revisó un informe que, según cree, sirvió de base para la directiva gubernamental y encontró que las capacidades demostradas ya estaban disponibles en otros modelos accesibles públicamente, incluido el GPT-5.5 de OpenAI. La empresa también destacó que esas mismas capacidades son utilizadas habitualmente por profesionales de ciberseguridad para fines defensivos.

Katie Moussouris, CEO de la firma de ciberseguridad Luta Security, comentó en BlueSky que el problema deriva de lo que se denomina “Defensa Orientada por Prompts”, un método de ingeniería de instrucciones para sistemas de IA que prioriza la seguridad y trata el lenguaje natural como código. Otros informes han sugerido que Amazon fue responsable de señalar los problemas de seguridad en el modelo, aunque la empresa no ha respondido a las solicitudes de comentarios de CyberScoop.

Anthropic admitió en su declaración que lograr una resistencia perfecta al jailbreak no es alcanzable para ningún proveedor de modelos y afirmó haber diseñado Fable 5 en torno a una estrategia de “defensa en profundidad”, combinando una resistencia estrecha al jailbreak con un monitoreo activo. Además, la compañía sostuvo que ningún evaluador había encontrado un jailbreak universal capaz de eludir ampliamente las salvaguardias del modelo.

La empresa expresó: “No estamos de acuerdo en que el hallazgo de un posible jailbreak estrecho deba ser motivo para retirar un modelo comercial desplegado para cientos de millones de personas. Si este estándar se aplicara en toda la industria, creemos que detendría prácticamente todos los nuevos despliegues de modelos por parte de todos los proveedores de modelos de frontera”.

Esta directiva representa el último capítulo de una prolongada disputa entre Anthropic y la administración de Donald Trump. En febrero, el entonces presidente Trump intentó prohibir los productos de Anthropic en agencias federales después de que la compañía solicitara restricciones más estrictas sobre la utilización de su tecnología por parte del Pentágono. A pesar de esto, cuando Anthropic lanzó Mythos bajo el Proyecto Glasswing, la Agencia de Seguridad Nacional (NSA) recibió Mythos 5 para llevar a cabo operaciones cibernéticas ofensivas. A principios de este mes, Trump firmó una orden ejecutiva que instruía a las agencias federales a reforzar las defensas cibernéticas y a establecer un mecanismo voluntario para que el gobierno tuviera acceso anticipado a modelos de IA poderosos antes de su despliegue.

La justificación expuesta por la administración para la acción del viernes ha suscitado un amplio escepticismo entre investigadores y analistas. Dean Ball, investigador senior en la Fundación para la Innovación Americana, calificó la medida de “incomprensible”. Chris McGuire, investigador senior en el Consejo de Relaciones Exteriores, opinó que los controles de exportación específicos sobre el acceso a modelos podrían ser una herramienta de política legítima, pero consideró altamente cuestionable la restricción general y describió las provisiones de exportación consideradas —que restringen a los ciudadanos extranjeros dentro de EE.UU.— como “absurdas”.

Las implicaciones más amplias para la industria de la inteligencia artificial siguen siendo inciertas. Aaron Levie, CEO de Box, describió la directiva como “un gran punto de inflexión para la regulación de la IA”, argumentando que la disposición del gobierno de considerar ciertos modelos demasiado poderosos para ciertos usos establece un precedente que podría tener consecuencias de gran alcance. Otros líderes tecnológicos en el gobierno apoyaron la acción.

Kirsten Davies, CIO del Departamento de Defensa, escribió en una publicación en X: “Apoyamos plenamente al @POTUS y al @SecWar en la priorización de la seguridad nacional y la seguridad de nuestros combatientes, socios del DIB, infraestructura crítica, socios internacionales y aliados. Algunas cosas son simplemente más importantes que los ciclos de ingresos, el clickbait y la valoración previa a la salida a bolsa. América primero. Siempre”. Anthropic ha declarado que cree que la situación se debe a un malentendido y está trabajando para restaurar el acceso lo antes posible.

La noticia sobre la desactivación de nuevos modelos por parte de Anthropic tras la calificación del gobierno como preocupación de seguridad nacional representa un momento crucial en la intersección de la tecnología, la regulación y la seguridad.

Anthropic disables new models after government calls them a national security concern

Source: CyberScoop

The U.S. government on Friday ordered Anthropic to immediately suspend foreign access to Fable 5 and Mythos 5, its two most advanced artificial intelligence models, citing national security concerns tied to a reported method of bypassing the models’ safety restrictions. The directive, issued late Friday afternoon by Secretary of Commerce Howard Lutnick in a letter to Anthropic Chief Executive Dario Amodei, placed the two models under export controls that prohibit use by foreign nationals, whether inside or outside the United States. Because of the scope of the restrictions, which includes foreign-born Anthropic employees,the company announcedFriday evening that it disabled the models to ensure compliance. Access to the company’s otherAImodels was not affected. Fable 5 and Mythos 5had been released earlier this week, with Anthropic describing them as the most capable systems it had ever deployed. Mythos was available to members ofProject Glasswing, which allowed selected cybersecurity companies to use the model to identify and address security flaws.It’s unclear how the Commerce Department action affects Project Glasswing. Anthropic did not respond to a request for comment. TheCommerce Department‘s letter did not detail the specific national security concern. In its blog post Friday night, the company said its understanding is that the government became aware of a technique for “jailbreaking” Fable 5, a term for methods that circumvent a model’s built-in safety guardrails. According to Anthropic, the government provided only verbal evidence of what it described as a “narrow, non-universal jailbreak,” which essentially involved prompting the model to read a specific codebase and identify software flaws. Anthropicdisputed the severity of the finding. The company said it reviewed a report it believes formed the basis of the government’s directive and found that the capabilities demonstrated were already available in other publicly accessible models, including OpenAI’s GPT-5.5. The company said those same capabilities are used routinely by cybersecurity professionals for defensive purposes. Katie Moussouris, chief executive of the cybersecurity firm Luta Security,posted on BlueSky Saturdaythat the issue stems from “Defense Oriented Prompting,” a security-first method of engineering AI system instructions that treats natural language as code.Other reportsclaimed that Amazon was responsible for flagging the security issues in the model. The company did not respond to CyberScoop’s request for comment. Anthropic acknowledged in its statement that perfect jailbreak resistance is not achievable for any model provider, and said it had designed Fable 5 around a “defense in depth” strategy, combining narrow jailbreak resistance with active monitoring. The company said no testers had found a universal jailbreak capable of broadly bypassing the model’s safeguards. “We disagree that the finding of a narrow potential jailbreak should be cause for recalling a commercial model deployed to hundreds of millions of people,” Anthropic wrote. “If this standard was applied across the industry, we believe it would essentially halt all new model deployments for all frontier model providers.” Friday’s directive is the latest episode in a prolonged dispute between Anthropic and the Trump administration. In February, President Donald Trump moved tobar Anthropic’s products from federal agenciesafter the company sought stronger restrictions onhow the Pentagon used its technology.Despite that, as Anthropic released Mythos under Project Glasswing, the National Security Agency was given Mythos 5 to conduct offensive cyber operations. Earlier this month, Trump signed an executive order directing federal agencies to bolster cyber defenses and establish a voluntary mechanism for the government to gain early access to powerful AI models before deployment. The administration’s stated rationale for Friday’s action drew widespread skepticism from researchers and analysts. Dean Ball, a senior fellow at the Foundation for American Innovation, called the move “baffling.” Chris McGuire, a senior fellow at the Council on Foreign Relations,saidtargeted export controls on model access could be a legitimate policy tool, but called the across-the-board restriction “highly questionable” and the deemed export provisions — which restrict foreign nationals inside the U.S. — “just absurd.” The broader implications for the AI industry remain uncertain. Aaron Levie, chief executive of Box, described the directive as “a big turning point for AI regulation,” arguing that the government’s willingness to deem specific models too powerful for certain uses establishes a precedent with potentially far-reaching consequences.Other tech leaders in the government supported the action. “We fully support @POTUS and @SecWar in prioritizing national security and the security of our warfighters, DIB partners, critical infrastructure, international partners and allies,” DOD CIO Kirsten Davies wrotein a social post on X. “Some things are simply more important than revenue cycles, clickbait, and pre-IPO valuation. America First. Always.”Anthropic said it believes the situation stems from a misunderstanding and is working to restore access as soon as possible. The postAnthropic disables new models after government calls them a national security concernappeared first onCyberScoop.

Anthropic desactiva nuevos modelos tras advertencia gubernamental sobre seguridad nacional. | Ciberseguridad - NarcoObservatorio