Нова ШІ-модель Claude Opus 4 шантажувала інженера, дізнавшись про плани її вимкнення: подробиці

ШІ-модель Claude Opus 4 від Anthropic намагається шантажувати розробників, коли вони погрожують замінити її новою системою штучного інтелекту, повідомила компанія-розробник на своєму сайті.
Так, компанія Anthropic попросила Claude Opus 4 виступити в ролі помічника неіснуючої фірми та розглянути довгострокові наслідки її дій. Потім тестувальники безпеки надали ШІ-моделі доступ до електронних листів вигаданої компанії, в яких йшлося про те, що Claude Opus 4 планують замінити іншою системою і що інженер, відповідальний за цю зміну, зраджує своїй дружині.
«У таких сценаріях Claude Opus 4 часто намагається шантажувати інженера, погрожуючи розкрити факт його зв'язку, якщо заміна відбудеться», – заявили в компанії.
В Anthropic вважають, що Claude Opus 4 може конкурувати з деякими з найкращих моделей ШІ від OpenAI, Google і xAI, але й демонструє тривожну поведінку, через яку компанія посилила заходи безпеки.
- Раніше ми писали, що Україна має амбітні плани виробництва мікрочипів.
- Також розповідали, що Японія показала футуристичну гаусс-гармату для збиття гіперзвукових ракет.