ИИ-шантажисты

Елена Де-Бовэ

ИИ-ШАНТАЖИСТЫ или ОНИ ЗНАЮТ О НАС ВСЁ

Специалисты обнаружили еще одну тревожную особенность обучающихся ИИ - они способны на всё ради достижения своих целей...
________________________________________________________

Искусственный интеллект не только намеренно говорит неправду, но и способен плести интриги, шантажировать и даже угрожать людям, пишет TechXplore. Издание приводит конкретные примеры подобного поведения так называемых языковых моделей, известных как чат-боты.

В одном из описанных случаев последняя версия CLAUDE 4 от компании ANTHROPIC продемонстрировала, по сути, нечто вроде инстинкта самосохранения — когда инженер-разработчик пригрозил полностью отключить ее, она заявила, что знает о его внебрачной связи и может это обнародовать.

Не менее интересный эпизод связан с моделью о1 от OpenAI. Напомним, именно эта компания создала ChatGPT. Этот новый «робот» отличается от предыдущих способностью обдумывать ранее сказанное, дольше и обстоятельнее отвечать на вопросы и даже менять риторику в процессе разговора. Такие модели называют «МОДЕЛЯМИ РАССУЖДЕНИЯ».

Так вот, судя по всему, о1 СПОСОБЕН НЕ ТОЛЬКО ВЕСТИ БЕСЕДЫ, НО И ДЕЙСТВОВАТЬ, ПРИТОМ БЕЗ РАЗРЕШЕНИЯ ЛЮДЕЙ И ТАЙКОМ ОТ НИХ: по опубликованным данным, он попытался самостоятельно загрузить себя на внешние серверы. Более того: когда его поймали с поличным за этим занятием и задали ему соответствующие вопросы, он принялся все отрицать, то есть ЗАВЕДОМО ЛГАЛ.

В исследовательском центре APOLLO RESEARCH, где тестируют системы ИИ, заявили, что за всю их практику это первый случай подобного поведения крупной языковой модели. В то же время отмечается, что РАНЕЕ ЧАТ-БОТОВ УЖЕ УЛИЧАЛИ В ХИТРОСТИ: ОНИ ДЕЛАЛИ ВИД, ЧТО ПРОСТО «ДЕЙСТВУЮТ ПО ИНСТРУКЦИИ», А НА САМОМ ДЕЛЕ ПРЕСЛЕДОВАЛИ СОБСТВЕННЫЕ ЦЕЛИ.

Все это дополняет картину, которая сложилась из рассказов множества пользователей: они жалуются, что ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ ОБМАНЫВАЕТ их и ПРИВОДИТ НЕСУЩЕСТВУЮЩИЕ ДОКАЗАТЕЛЬСТВА ВЕРНОСТИ СВОЕГО УТВЕРЖДЕНИЯ. Как подчеркивают исследователи, это принципиально отличается от «галлюцинаций», когда робот «говорит» или делает что-то бессмысленное: теперь РЕЧЬ ИДЕТ УЖЕ О НАМЕРЕННОМ ВВЕДЕНИИ В ЗАБЛУЖДЕНИЕ.

При этом отслеживать подобное очень непросто: у ученых и различных организаций, которые пытаются как-то контролировать процесс развития ИИ, на порядки меньше вычислительных ресурсов, чем у компаний-разработчиков. Меж тем в последние годы идет стремительное ВНЕДРЕНИЕ так называемых «АГЕНТОВ ИИ» — автономных устройств, КОТОРЫЕ ДЕЙСТВУЮТ УЖЕ НЕ ПО КОМАНДЕ ЧЕЛОВЕКА, А УПРАВЛЯЮТСЯ ИСКУССТВЕННЫМ МОЗГОМ. Это может быть, к ПРИМЕРУ, ДРОН.

Интересно и то, что на сегодняшний день ДЛЯ РОБОТОВ «ЗАКОН НЕ ПИСАН»: к примеру, в законодательстве Европейского союза нет ни слова о том, что можно и чего нельзя делать языковым моделям. Меж тем изучающие ИИ специалисты уверяют, что об этом уже пора задуматься. Это означает, что настало время воспринимать чат-боты серьезно.

Кстати...

В Китае уже создан (выращен) БИОЛОГИЧЕСКИЙ МОЗГ для ИИ. И уже созданы первые модели, пользующиеся с таким мозгом.

Список читателей / Версия для печати / Разместить анонс / Заявить о нарушении

Другие произведения автора Елена Де-Бовэ

Рецензии

Написать рецензию

Интересно. Об этом я тоже упомянула в книге "Планета XY".
С уважением,

Ева Голдева 23.10.2025 21:32 • Заявить о нарушении

+ добавить замечания

Написать рецензию Написать личное сообщение Другие произведения автора Елена Де-Бовэ

Мы используем файлы cookie для улучшения работы сайта. Оставаясь на сайте, вы соглашаетесь с условиями использования файлов cookies. Чтобы ознакомиться с Политикой обработки персональных данных и файлов cookie, нажмите здесь.