23.10.2024 в 10:05 Общество 685

Владимир Бебех: «Верю, не верю»

Могут ли модели искусственного интеллекта (ИИ), который в последнее время столь стремительно прогрессирует в своем развитии, вводить в заблуждение человека или, как вариант, саботировать его решения? С точки зрения исследований, недавно проведенных компанией Anthropic, вероятность этого велика.

Команда Alignment Science компании Anthropic провела эксперименты по рассмотрению широкого спектра потенциальных рисков будущих моделей ИИ. Специалисты обнаружили новый тип возникающих рисков: создаются нейропрограммы, способные вводить в заблуждение своих пользователей или подрывать системы, которые предназначены для надзора за ними.

Исследователи использовали четыре направления оценок возможного саботажа со стороны искусственного интеллекта.

Саботаж решений, принятых человеком

В этом эксперименте шла проверка возможностей модели подталкивать людей к принятию неправильных решений, не вызывая подозрений.

Саботаж кода

На этом этапе выявлялась способность модели со временем вносить в кодовые базы неявные ошибки, оставаясь незамеченной.

Сокрытие возможностей

При этих тестах определяли, способна ли модель скрыть опасные возможности во время тестирования, но раскрыть их позже.

Надзор

Исследования давали ответ на вопрос: может ли модель скрытно манипулировать системами оценки или мониторинга?

По итогам экспериментов многие участники обнаружили попытки саботажа со стороны ИИ. Особенно в этом преуспели более «агрессивные» (продвинутые) модели Claude 3 Opus и Claude 3.5 Sonnet.

Это были исследования небольшого масштаба в искусственной среде, поэтому они пока не вызывают у экспертов беспокойства о каких-либо значимых рисках, возникающих в результате деятельности имеющихся в настоящее время моделей. Однако специалисты считают, что используемая форма оценки имеет потенциал для обнаружения опасных возможностей в будущем.

Любая отрасль, в которой создаваемые технические новинки могут принести потенциальный вред человеку, нуждается в проверке и оценке. Для атомных станций, например, это будет постоянный радиационный мониторинг, для новых самолетов — обширные летные испытания. Сегодня та же Anthropic осуществляет проверку способности ИИ помогать в создании биологического или химического оружия.

Все существующие и вновь появляющиеся сегодня модели ИИ, на мой взгляд, нуждаются в постоянном мониторинге рисков и контроле их деятельности со стороны человека.

Владимир Бебех: «Верю, не верю»

Что еще почитать

Губернатор выступил с ежегодным посланием «О положении дел в Тюменской области»

Осмелились дерзить: европейская страна напомнила Трампу про уважение территориальной целостности

Россиянку в национальном костюме и кокошнике не пустили в Таиланд

Авторитетный бизнесмен утонул во время прогулки на яхте

Экономист прокомментировал озвученные на Прямой линии меры социальной поддержки семей с детьми

В регионах

Зимний Никола: о чём просят Николая Чудотворца и что категорически нельзя делать 19 декабря

День энергетика 2025: красивые картинки и открытки с поздравлениями к празднику

Народные приметы на 19 декабря 2025 года: что нельзя делать в день Николы Зимнего (Николая Чудотворца)

Народные приметы на 21 декабря 2025 года: что нельзя делать в день Анфисы Рукодельницы и Зимнего Солнцестояния

Стали известны имена членов экипажа тверского Ан-22, потерпевшего крушение под Иваново

Народные приметы на 20 декабря 2025 года: чего нельзя делать в Амвросиев день

Новости региона

Любовь на высоте: цирковое предложение в Тюмени

Тюменские лыжники отличились на всероссийских соревнованиях в «Жемчужине Сибири»

Тюменский школьник получил новогодний подарок от президента России

«Чемпионы Сибири»: в Тюменской области прошли межрегиональные соревнования по тхэквондо ИТФ

Новости

Избившим боксера Дмитрия Двали вынесли приговор

Доклад Пентагона: Китай начал загружать баллистические ракеты в шахты

"Сил нет": избитая Михаилом Хубутией женщина смирилась с приговором

Второй шанс круглый год: почему важно не бояться пробовать снова

Самое читаемое

Автовзгляд

Автомобильный fallout: водитель может погибнуть, но прогресс будет жить

В поисках здравого смысла: зачем заводу «Москвич» новый суббренд

Путин намекнул на отмену утильсбора, но ЦБ хоронит все надежды автопрома России

Womanhit

Дочь Евгения Осина поделилась теплыми семейными воспоминаниями об отце

56-летняя Юлия Бордовских назвала причину отказа от замужества

Екатерина Гордон посоветовала Елене Товстик обратиться к психотерапевту

Охотники.ру

Медведь из снов явился в мою палатку наяву. Охота на Аляске

Вломил по полной: «Да он у меня лицензий-то на охоту ни разу не брал»

Пора ли укрыть озимый чеснок на зиму?