Администрация США настаивает на том, чтобы разработчик ИИ Anthropic устранил уязвимости в своих моделях, позволяющие обходить защитные механизмы. Эксперты сомневаются в возможности полного устранения таких уязвимостей.
Администрация президента США требует от компании Anthropic принять меры для предотвращения «джейлбрейков» — методов, позволяющих обойти встроенные в модели искусственного интеллекта (ИИ) защитные механизмы.
Эти уязвимости могут дать доступ к возможностям моделей, связанным с кибербезопасностью, химией и биологией. Речь идет, в частности, о модели Claude Fable 5, которая была временно приостановлена из-за опасений, связанных с ее возможным неправомерным использованием.
Представители американских властей считают, что Anthropic должна самостоятельно тестировать свои передовые ИИ-модели на предмет подобных уязвимостей и информировать о них правительство.
Независимые эксперты в области кибербезопасности выражают сомнения в том, что полностью исключить возможность «джейлбрейков» возможно. По их мнению, защитные барьеры в моделях ИИ являются временным решением, поскольку опытные пользователи и будущие разработки смогут находить способы их обхода.
Anthropic заявляет, что опасения администрации преувеличены, а реальные последствия таких обходов минимальны. Компания провела встречу с представителями Министерства торговли и Национального управления киберпространства для обсуждения этих вопросов, но стороны не пришли к единому мнению.


