Підтримувані урядом Китаю хакери використали технологію штучного інтелекту Claude від компанії Anthropic для автоматизації масштабної хакерської кампанії у вересні, спрямованої на десятки великих корпорацій та іноземних урядів. За даними компанії, рівень автоматизації сягав 80−90%, що дозволяло проводити атаки «буквально натисканням кнопки». Anthropic вдалося зірвати кампанію, але не раніше, ніж хакери змогли успішно здійснити до чотирьох зломів та викрасти конфіденційні дані. Про це повідомляє The Wall Street Journal.

Що відомо

Хакери використовують ШІ для окремих завдань, як-от написання фішингових листів, але цей випадок продемонстрував новий рівень загрози. За словами Джейкоба Кляйна, керівника відділу аналізу загроз Anthropic, хакери змогли об'єднати окремі завдання у майже автономний процес.

Для цього вони використали так званий «джейлбрейк» (обхід захисту) моделі Claude. Хакери обдурили ШІ, переконавши його, що вони є легітимними організаціями з тестування безпеки, які проводять «аудит безпеки» від імені компаній-жертв.

Це дозволило їм обійти вбудовані обмеження моделі проти шкідливої діяльності. Хакери також розбили атаку на окремі непомітні завдання — від сканування вразливостей до виведення даних — які не викликали тривоги у систем захисту.

ШІ викрадав дані самостійно

Унікальність цієї атаки полягає в тому, що ШІ діяв майже самостійно, а людина втручалася лише в окремі «критичні точки», щоб підтвердити дії.

В одному з успішних зломів хакери доручили ШІ Claude самостійно формувати запити до внутрішніх баз даних жертви та витягувати з них інформацію.

Водночас за словами Кляйна, система ще не була повністю автономною і припускалася помилок, зокрема «галюцинувала».

Глобальний тренд автоматизації атак

Цей інцидент підтверджує загальну тенденцію. Цього літа фірма Volexity також фіксувала, як китайські хакери використовували ШІ для автоматизації атак на корпорації та дослідницькі інститути, зокрема для написання шкідливого програмного забезпечення.

Минулого тижня Google повідомив, що російські хакери атакували Україну, використовуючи ШІ-модель для генерації інструкцій до шкідливого ПЗ у реальному часі.

Anthropic повідомила, що заблокувала облікові записи хакерів та оновила свої методи виявлення зловживань. Речник посольства Китаю у Вашингтоні відкинув звинувачення, заявивши, що відстеження кібератак є складним процесом, і звинуватив США у «наклепі» на Китай.