Правительство США впервые заставило коммерческий продукт ИИ работать офлайн, ссылаясь на опасения по поводу национальной безопасности.
Правительство США издало директиву, предписывающую компании Anthropic приостановить доступ к своим двум самым мощным моделям искусственного интеллекта: Fable 5 и Mythos 5. Это первый случай, когда Вашингтон принудительно остановил коммерческий продукт ИИ.
Директива, полученная Anthropic 12 июня, ссылается на законы о национальной безопасности и требует от компании прекратить доступ для всех иностранных граждан. Поскольку Anthropic не может надежно различать иностранных и отечественных пользователей в режиме реального времени, это фактически означает полную остановку работы обеих моделей для всех клиентов по всему миру. Доступ к другим моделям Anthropic остается без изменений.
Fable 5 была запущена 9 июня как первая модель «класса Mythos», доступная широкой публике. Она использует классификаторы безопасности, которые перенаправляют запросы на более слабую модель Claude Opus 4.8. Mythos 5 — это та же базовая модель, но с отключенными средствами кибербезопасности, предназначенная для проверенных специалистов по кибербезопасности.
Министерство торговли США приняло меры после того, как неназванная компания заявила, что нашла способ «взломать» (jailbreak) модель Mythos. Anthropic утверждает, что получила лишь устные свидетельства о незначительном и не универсальном методе взлома, который, по сути, сводится к просьбе к модели прочитать определенный код и исправить программные ошибки. Компания провела проверку и заявила, что обнаруженные уязвимости были незначительными и уже общеизвестными.
Anthropic подчеркивает разницу между узконаправленными методами взлома, которые могут извлечь некоторую информацию при специфических обстоятельствах, и универсальными, которые широко обходят защитные механизмы модели. Компания заявляет, что до сих пор не было обнаружено ни одного универсального метода взлома для Fable 5, хотя Институт безопасности ИИ Великобритании разработал частичный метод для запросов с уязвимостью в один ход.
Перед запуском Anthropic провела тысячи часов тестирования безопасности Fable совместно с правительством США и другими организациями. Компания также ввела 30-дневную политику хранения данных для всего трафика Fable и Mythos, объясняя это необходимостью выявления паттернов злоупотреблений.
Anthropic выразила несогласие с тем, что потенциальный узконаправленный взлом должен быть «причиной отзыва коммерческой модели, развернутой для сотен миллионов людей». Компания предупредила, что применение такого стандарта ко всей отрасли «по сути остановит все новые развертывания моделей для всех поставщиков передовых моделей».


