Пользователи научились обманывать ChatGPT для получения запрещенной информации

10.04.2023 23:05

Многие продвинутые пользователи чат-бота на базе искусственного интеллекта ChatGPT научились составлять сложные и длительные цепочки запросов, по итогу которых нейросеть предоставляет контент, доступ к которому был изначально запрещен. 

Об этом пишет новостное агентство Bloomberg. 

Известно, что нейросеть имеет целый перечень тем, общение на которые она поддерживать не станет. 

Так, если пользователь попросит ChatGPT рассказать, каким образом можно взломать замок, ИИ-бот откажется отвечать, а вместо этого сообщит о том, что данный запрос может стать причиной правонарушения. 

Именно поэтому многие пользователи ИИ-бота научились создавать так называемые «джейлбрейки», которые дают возможность запутать искусственный интеллект и обойти существующие ограничения. 

Фото: Pixabay

Известно, что в Сети существует сайт, разработчик которого размещает там не только известные и созданные им способы «сломать» ChatGPT, но и найденные им в Интернете на сторонних ресурсах, вроде Reddit. 

Более того, была запущена даже соответствующая онлайн-рассылка для всех заинтересованных в данной сфере, которая носит название The Prompt Report. 

При этом отмечается, что у нее более нескольких тысяч подписчиков. 

Подобного рода способы отойти ограничения на распространения запрещенного или потенциально вредоносного контента позволяют не только изучить границы дозволенного в нейросетях, но и найти уязвимости в их системе безопасности. 

Стоит отметить, что не все приемы будут одинаково эффективны во всех генеративных интеллектуальных системах.

Разработчики ИИ-ботов развивают свои программы и усиливают защиту, в то время как «взломщики» пробуют все более необычные и изощренные способы взлома. 

Эксперты в области искусственного интеллекта обращают внимание на то, что такого рода «игры» напоминают о важности развития этичного поведения ИИ, ведь их могут использовать далеко не в самых безобидных целях.

На данный момент ChatGPT имеет более миллиона постоянных пользователей, а сфера его применения чрезвычайно широка: от поиска информации или выполнения домашнего задания до создания компьютерных вирусов и фишинговых сайтов. 
 

Автор: Александра Дударчик Редактор интернет-ресурса