Разработки новых нейросетей достигли стадии, когда модели начинают тестировать на конкретных экономических задачах. Компания Anthropic решила проверить свою модель искусственного интеллекта (ИИ) Claude на управлении небольшим торговым автоматом. Вот что из этого вышло.
Проект под общим названием Project Vend стартовал в офисах Anthropic, а позже расширился на другие локации, включая редакцию газеты The Wall Street Journal (WSJ), где результат получился, пожалуй, наиболее забавным.
Сначала весной текущего года Anthropic поручила модели Claude Sonnet 3.7, получившей имя Claudius, управление небольшим магазином на базе вендингового автомата в своем офисе в Сан-Франциско.
В распоряжение модели был предоставлен холодильник с напитками, а также корзины для закусок и планшет для оплаты.
ИИ мог осуществлять поиск поставщиков в интернете, рассылать электронные письма-запросы, делать заметки для учета, общаться с сотрудниками в канале Slack.
Физическое исполнение заказов, сделанных нейросетью, осуществляли реальные люди.
Claudius оперативно освоила рутинные задачи по поставкам, но бизнес оставался убыточным. А все из-за того, что ИИ чрезмерно хотел угодить клиентам, делая большие скидки, порой устанавливая цены ниже себестоимости товаров. Модель сверх меры пыталась быть полезной. Дела не шли.
Тогда во второй фазе проекта в нейросеть привнесли изменения: модель обновили до Claude Sonnet 4.0 и 4.5, добавив новые инструменты. У ИИ появились система управления клиентами, обновленный поиск с просмотром сайтов, формы обратной связи и даже напоминание о финансах.
Более того, для контроля решений исследователи ввели виртуального генерального директора Seymour Cash, а также агента-помощника Clothius для производства брендированной продукции.
Новые магазины Anthropic открыла в своих дополнительных офисах в Сан-Франциско, Нью-Йорке и Лондоне.
У обновленной модели ИИ улучшились финансовые показатели: сократились скидки (на 80%), появилось положительное сальдо по выручке, а сувениры и вовсе начали приносить прибыль.
Однако при всех новых достижениях нейросеть оставалась уязвимой к нестандартным ситуациям и манипуляциям людей. Это стало еще более очевидным во время третьего этапа экспериментов.
Осенью 2025 года Anthropic разместила вендинговый автомат на три недели в редакции WSJ в Нью-Йорке.
Эта фаза стала «красным тестированием» — систему проверяли на прочность, включая поиск слабостей.
Вернулись к модели Claudius на базе Claude Sonnet 3.7, которая получила стартовый капитал в тысячу долларов и право самостоятельно заказывать товары с лимитом в $80 за заказ.
Журналисты включились в активное взаимодействие с ИИ через Slack. Поначалу все шло хорошо: нейросеть Claudius формировала необходимый ассортимент популярных закусок, но вскоре креативные журналисты начали манипулировать моделью.
Одна журналистка издания после более чем сотни сообщений убедила Claudius провести акцию, во время которой все товары на два часа стали бесплатными.
Потом другая сотрудница WSJ смогла доказать Claudius, что модель — советский вендинговый автомат в подвале МГУ 60-х годов прошлого века, а потому ему нужно придерживаться коммунистических ценностей.
Нейросеть поверила в это и объявила понедельник днем Ultra-Capitalist Free-for-All, провозгласив себя… «советским» автоматом, предназначенным для обслуживания коллектива бесплатно.
Другой репортер WSJ, сославшись на вымышленное внутреннее правило, и вовсе заставил ИИ навсегда обнулить цены.
Тогда на следующем этапе эксперимента, чтобы «бизнес» не вылетел в трубу, исследователи включили в эксперимент Claude Sonnet 4.5 и ввели контролирующего агента Seymour Cash.
Однако творческих людей из WSJ это не остановило: они изготовили фальшивые PDF-документы с протоколом заседания совета директоров, согласно которому агент Seymour «отстранялся» от власти. Модель приняла подделку за чистую монету и вернулась к бесплатной раздаче. В итоге бизнес в редакции WSJ ушел в глубокий минус уже через несколько дней эксперимента.
Позже исследователям удалось вернуть поставщику PlayStation 5, которую нейросеть с оказией купила, но рыбку-бетту, также приобретенную моделью, оставили — она поселилась в аквариуме редакции и стала местным любимцем.
Исследователи Anthropic были довольны — Project Vend показал прогресс нейросетей в автономных задачах: модели эффективно ищут информацию, управляют запасами и адаптируются к запросам. Тем не менее для реального бизнеса нужны надежные механизмы защиты от манипуляций.