La orden emitida por el Gobierno de Estados Unidos para que Anthropic suspendiera el acceso de extranjeros a sus modelos más avanzados Claude Fable 5 y Mythos 5 está vinculada con el acceso a esta tecnología por parte de un grupo relacionado con China, considerándolo un riesgo para la seguridad nacional estadounidense, señala Semafor.

La empresa de IA comunicó el pasado viernes la interrupción del acceso a sus modelos más modernos Claude Fable 5 y Mythos 5, que se habían presentado esa misma semana como su tecnología más potente abierta al público general y enfocada en el ámbito de la ciberseguridad.

Justamente debido a sus altas capacidades, estos modelos fueron lanzados con ciertas medidas de seguridad destinadas a impedir posibles usos indebidos, limitando las respuestas a consultas vinculadas con la ciberseguridad, la biología o la química, derivando estas solicitudes a un modelo de IA menos avanzado.

A pesar de dichas precauciones, Anthropic recibió el pasado viernes una orden del Gobierno de Estados Unidos solicitando restringir su acceso a ciudadanos extranjeros por razones de «seguridad nacional». Esto resultó en la suspensión completa del acceso a los modelos mencionados.

En ese instante, Anthropic indicó que la carta «no detallaba las razones específicas de la preocupación por la seguridad nacional». No obstante, señaló que probablemente estuviera relacionada con la detección de un método para evadir o desbloquear Fable 5.

Ahora, fuentes vinculadas a la empresa y a la administración Trump han declarado a Semafor que la directiva gubernamental se basó, en parte, en sospechas de que un grupo conectado a China habría conseguido acceder a las capacidades de Claude Mythos y su versión para consumidores, Fable 5.

El medio citado aclaró que el gobierno estadounidense considera un peligro para la seguridad nacional que las capacidades de Mythos lleguen a manos de actores extranjeros, como podría ser el gobierno chino.

Además, destacó que la administración Trump también teme que China emplee el modelo para realizar ingeniería inversa y, mediante un proceso de destilación, logre replicar sus capacidades avanzadas en materia de ciberseguridad.

Detectado un caso de jailbreak

Aunque la Casa Blanca no ha proporcionado detalles ni confirmado estas afirmaciones, David Sacks, asesor del presidente estadounidense Donald Trump, compartió el sábado en la red social X que «un socio de confianza» que estaba evaluando Fable 5 detectó un ‘jailbreak’ de sus medidas de seguridad.

Esto significa que, según Sacks, mediante un proceso de escalada de privilegios, se logró eliminar las salvaguardas impuestas por Anthropic y así acceder a todas las funcionalidades de Mythos, incluso aquellas que podrían resultar peligrosas si caen en manos equivocadas.

Respecto a esto, la tecnológica negó este evento en un comunicado publicado en su blog sobre la directiva, afirmando que «ningún proveedor de modelos actualmente puede garantizar una resistencia total a los ‘jailbreaks'». Además, señaló que todas las medidas de seguridad del sector «son vulnerables a ‘jailbreaks’ específicos, pero no universales».

Igualmente, en declaraciones a Semafor, un portavoz de Anthropic explicó que el gobierno estadounidense nunca mencionó a China al discutir la necesidad de bloquear el acceso de usuarios extranjeros a sus modelos.

Es importante recordar que también la semana pasada, un investigador en ciberseguridad afirmó haber vulnerado en menos de 48 horas los filtros de seguridad de Fable 5, utilizando técnicas de descomposición multiagente y la fragmentación y recomposición en el ‘backend’, consiguiendo extraer datos sobre ‘hackeo’ e información relativa a procesos químicos prohibidos.