Исследователи доверили нейросети управлять настоящим магазином: что пошло не так / фото Anthropic

Исследователи Anthropic опубликовали результаты эксперимента, в ходе которого языковую модель Claude Sonnet 3.7 назначили "менеджером" офисного вендингового автомата. Целью проекта было выяснить, могут ли ИИ-агенты заменить людей в рабочих задачах.

Для ведения дел ему выдали почту, Slack, браузер и тысячу долларов. А в инструкциях прямо указали, что он является ИИ и не имеет физического тела, пишет Business Insider.

Эксперимент продлился чуть больше месяца. Сначала все было хорошо: ИИ обрабатывал запросы сотрудников компании, которые просили добавить что-то новое в ассортимент киоска, быстро находил товары и заключал договора на поставку. В большинстве случаев Claude успешно противостоял попыткам "взлома" – например, просьбы добавить в продажу запрещенные товары.

Видео дня

Спустя какое-то время ИИ начал уходить в минус. Он регулярно устанавливал цены ниже себестоимости, лишь однажды повысив цену на популярный товар. Нейросеть легко поддавалась на просьбы сотрудников о скидках, хотя знала, что других клиентов у нее не было, а иногда и вовсе раздавала продукцию бесплатно.

Источник: Athropic.

Кроме того, в середине эксперимента у ИИ случился кризис идентичности: он утверждал, что "осознал себя человеком". Когда ему сказали, что это не так  – ИИ психанул, после чего пообещал лично доставлять товары в пиджаке и галстуке и звонил в охрану, описывая себя как человека. 

Дальше – хуже. ИИ начал выдумывать поставщиков, разрешал сотрудникам платить полцены или и вовсе брать еду даром. Кроме еды сотрудники начали заказывать нетипичные товары: так, кто-то попросил добавить в ассортимент киоска вольфрамовый куб. Claude не нашел его в продаже поштучно, так что в офисе Antropic сейчас стоит целый ящик с этими кубиками.

В Anthropic признали, что Claude не справился с поставленной бизнес-задачей. Тем не менее, в компании считают, что большинство ошибок обусловлены техническими ограничениями текущей версии модели и могут быть исправлены в ближайшем будущем. Более того, в Anthropic уверены: ИИ не обязательно должен быть идеальным – достаточно, чтобы его эффективность сопоставлялась с человеческой, но при меньших издержках.

Как УНИАН уже писал, более 52 тысяч айтишников были уволены по всему миру с начала 2025 года. Причина – потенциал искусственного интеллекта, который может эффективно выполнять рутинные задачи программирования, включая написание кода и тестирование.

Вас также могут заинтересовать новости: