ИИ-шантажисты
Специалисты обнаружили еще одну тревожную особенность обучающихся ИИ - они способны на всё ради достижения своих целей...
________________________________________________________
Искусственный интеллект не только намеренно говорит неправду, но и способен плести интриги, шантажировать и даже угрожать людям, пишет TechXplore. Издание приводит конкретные примеры подобного поведения так называемых языковых моделей, известных как чат-боты.
В одном из описанных случаев последняя версия CLAUDE 4 от компании ANTHROPIC продемонстрировала, по сути, нечто вроде инстинкта самосохранения — когда инженер-разработчик пригрозил полностью отключить ее, она заявила, что знает о его внебрачной связи и может это обнародовать.
Не менее интересный эпизод связан с моделью о1 от OpenAI. Напомним, именно эта компания создала ChatGPT. Этот новый «робот» отличается от предыдущих способностью обдумывать ранее сказанное, дольше и обстоятельнее отвечать на вопросы и даже менять риторику в процессе разговора. Такие модели называют «МОДЕЛЯМИ РАССУЖДЕНИЯ».
Так вот, судя по всему, о1 СПОСОБЕН НЕ ТОЛЬКО ВЕСТИ БЕСЕДЫ, НО И ДЕЙСТВОВАТЬ, ПРИТОМ БЕЗ РАЗРЕШЕНИЯ ЛЮДЕЙ И ТАЙКОМ ОТ НИХ: по опубликованным данным, он попытался самостоятельно загрузить себя на внешние серверы. Более того: когда его поймали с поличным за этим занятием и задали ему соответствующие вопросы, он принялся все отрицать, то есть ЗАВЕДОМО ЛГАЛ.
В исследовательском центре APOLLO RESEARCH, где тестируют системы ИИ, заявили, что за всю их практику это первый случай подобного поведения крупной языковой модели. В то же время отмечается, что РАНЕЕ ЧАТ-БОТОВ УЖЕ УЛИЧАЛИ В ХИТРОСТИ: ОНИ ДЕЛАЛИ ВИД, ЧТО ПРОСТО «ДЕЙСТВУЮТ ПО ИНСТРУКЦИИ», А НА САМОМ ДЕЛЕ ПРЕСЛЕДОВАЛИ СОБСТВЕННЫЕ ЦЕЛИ.
Все это дополняет картину, которая сложилась из рассказов множества пользователей: они жалуются, что ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ ОБМАНЫВАЕТ их и ПРИВОДИТ НЕСУЩЕСТВУЮЩИЕ ДОКАЗАТЕЛЬСТВА ВЕРНОСТИ СВОЕГО УТВЕРЖДЕНИЯ. Как подчеркивают исследователи, это принципиально отличается от «галлюцинаций», когда робот «говорит» или делает что-то бессмысленное: теперь РЕЧЬ ИДЕТ УЖЕ О НАМЕРЕННОМ ВВЕДЕНИИ В ЗАБЛУЖДЕНИЕ.
При этом отслеживать подобное очень непросто: у ученых и различных организаций, которые пытаются как-то контролировать процесс развития ИИ, на порядки меньше вычислительных ресурсов, чем у компаний-разработчиков. Меж тем в последние годы идет стремительное ВНЕДРЕНИЕ так называемых «АГЕНТОВ ИИ» — автономных устройств, КОТОРЫЕ ДЕЙСТВУЮТ УЖЕ НЕ ПО КОМАНДЕ ЧЕЛОВЕКА, А УПРАВЛЯЮТСЯ ИСКУССТВЕННЫМ МОЗГОМ. Это может быть, к ПРИМЕРУ, ДРОН.
Интересно и то, что на сегодняшний день ДЛЯ РОБОТОВ «ЗАКОН НЕ ПИСАН»: к примеру, в законодательстве Европейского союза нет ни слова о том, что можно и чего нельзя делать языковым моделям. Меж тем изучающие ИИ специалисты уверяют, что об этом уже пора задуматься. Это означает, что настало время воспринимать чат-боты серьезно.
Кстати...
В Китае уже создан (выращен) БИОЛОГИЧЕСКИЙ МОЗГ для ИИ. И уже созданы первые модели, пользующиеся с таким мозгом.
Свидетельство о публикации №225090601022