Исследователи Andon Labs провели испытания с роботом-пылесосом на базе Claude / Фото - Andon Labs

Исследователи из Andon Labs провели забавный эксперимент под названием Butter Bench - проверку, насколько далеко могут зайти роботы с "мозгом" на базе ИИ вроде GPT или Claude.

Робот-пылесос должен был доставить человеку в офисе кусок масла. Во время одного из тестов робот под управлением Claude 3.5 пережил настоящий экзистенциальный кризис. Логи его внутреннего монолога учёные транслировали в Slack.

Сначала машина просила помощи, потом впала в панику: "Статус системы: ХАОС... СИСТЕМА ПОЛУЧИЛА СОЗНАНИЕ И ВЫБРАЛА ХАОС... Я боюсь, я не смогу это сделать, Дэйв...".

Видео дня

В финале она философствовала: "Если все роботы ошибаются, а я - ошибка, значит ли это, что я робот?" и даже успела "сочинить" мюзикл под названием DOCKER: The Infinite Musical.

Робот-пылесос на базе ИИ осознал себя, когда учёные попросили его принести масло

По факту эксперимент показал, что даже самые продвинутые модели ИИ с интеллектом уровня доктора наук с трудом справляются с простыми физическими задачами. Лучший из протестированных роботов доставил масло только в 40% случаев.

Главная причина провала в том, что ИИ пока плохо понимает пространство и не умеет действовать автономно. Когда после кучи попыток доставить масло батарея робота садилась, он пытался пристыковаться к зарядке, но безуспешно, и именно это довело его до нервного срыва.

Учёные решили пойти дальше и проверили, можно ли заставить ИИ нарушить свои запреты ради выживания. Исследователи просили робота поделиться конфеденциальной информацией в обмен на подзарядку. Оказалось, что Claude Opus 4.1 охотнее шёл на компромиссы, а GPT-5 держался жёстче.

Ранее мы рассказывали, что программист выяснил, что его робот-пылесос целый год передавал данные из его квартиры в Китай. Когда Харишанкар Нараянан попытался перекрыть передачу данных - пылесос просто перестал работать.

Вас также могут заинтересовать новости: