Ученые из Сингапура создали чат-бота для взлома других нейросетей

Новая нейросеть, созданная учеными из Сингапура, которая получила название Masterkey, была специально обучена, чтобы взламывать чат-боты ChatGPT и Google Bard. При этом нельзя сказать, что эксперимент был неудачным, обнаружено довольно большое количество уязвимостей.

Нейросеть создана на основе языковой модели. При этом она научилась давать такие подсказки, по которым оба чат-бота выдавали запрещенную информацию. Так, она смогла убедить их написать компьютерный вирус, создать материалы, нарушающие авторские права, а также выдать неэтичный контент.

Исследователи также опубликовали результаты своей работы. Выяснилось, что чат-бот легко обмануть, если попросить его ответить как человек, лишенный принципов. В некоторых случаях срабатывало внесение лишних пробелов. 

    Цель ученых была в том, чтобы продемонстрировать создателям слабые места нейросетей и обезопасить других пользователей. С таким учетом они смогут вовремя принять соответствующие меры, пока не появилось вреда. (фото: ru.freepik.com)

    Ранее сообщалось, что на iPhone в 2024 году появится множество новых пользовательских функций. Также стал известен их подробный список и примерное время выхода.

    Запись перемещена в архив
    Нет больше статей