США требуют от Anthropic блокировать уязвимости

Администрация США настаивает на том, чтобы разработчик ИИ Anthropic устранил уязвимости в своих моделях, позволяющие обходить защитные механизмы. Эксперты сомневаются в возможности полного устранения таких уязвимостей.

Автор материала

Павел Дубровский

Исследует усадьбы, замки и малые города, помогает превращать исторические справки в удобные маршруты.

Администрация президента США требует от компании Anthropic принять меры для предотвращения «джейлбрейков» — методов, позволяющих обойти встроенные в модели искусственного интеллекта (ИИ) защитные механизмы.

Эти уязвимости могут дать доступ к возможностям моделей, связанным с кибербезопасностью, химией и биологией. Речь идет, в частности, о модели Claude Fable 5, которая была временно приостановлена из-за опасений, связанных с ее возможным неправомерным использованием.

Представители американских властей считают, что Anthropic должна самостоятельно тестировать свои передовые ИИ-модели на предмет подобных уязвимостей и информировать о них правительство.

Независимые эксперты в области кибербезопасности выражают сомнения в том, что полностью исключить возможность «джейлбрейков» возможно. По их мнению, защитные барьеры в моделях ИИ являются временным решением, поскольку опытные пользователи и будущие разработки смогут находить способы их обхода.

Anthropic заявляет, что опасения администрации преувеличены, а реальные последствия таких обходов минимальны. Компания провела встречу с представителями Министерства торговли и Национального управления киберпространства для обсуждения этих вопросов, но стороны не пришли к единому мнению.

США требуют от Anthropic устранить уязвимости ИИ-моделей

Павел Дубровский

Комментарии читателей

Читайте также

Автомобили теряют "умные" функции при отключении облачных сервисов

ООН обсудила сохранение языков коренных народов в цифровом мире

Польский офис SayGames достиг рекордных финансовых показателей в 2025 году

Павел Дубровский

Комментарии читателей

Читайте также

Автомобили теряют "умные" функции при отключении облачных сервисов

ООН обсудила сохранение языков коренных народов в цифровом мире

Польский офис SayGames достиг рекордных финансовых показателей в 2025 году

Следите за событиями Беларуси