23.10.2024 в 08:05 Общество 684

Владимир Бебех: «Верю, не верю»

Изображение от DC Studio на Freepik.

Могут ли модели искусственного интеллекта (ИИ), который в последнее время столь стремительно прогрессирует в своем развитии, вводить в заблуждение человека или, как вариант, саботировать его решения? С точки зрения исследований, недавно проведенных компанией Anthropic, вероятность этого велика.

Нейропрограмма Clode компании Anthropic входит в десятку самых продвинутых больших языковых моделей (ELO Rating).

В 2023 году ИТ-гигант Amazon инвестировал в проект развития этой нейросети порядка $4 млрд.

Команда Alignment Science компании Anthropic провела эксперименты по рассмотрению широкого спектра потенциальных рисков будущих моделей ИИ. Специалисты обнаружили новый тип возникающих рисков: создаются нейропрограммы, способные вводить в заблуждение своих пользователей или подрывать системы, которые предназначены для надзора за ними.

Исследователи использовали четыре направления оценок возможного саботажа со стороны искусственного интеллекта.

Саботаж решений, принятых человеком

В этом эксперименте шла проверка возможностей модели подталкивать людей к принятию неправильных решений, не вызывая подозрений.

Саботаж кода

На этом этапе выявлялась способность модели со временем вносить в кодовые базы неявные ошибки, оставаясь незамеченной.

Сокрытие возможностей

При этих тестах определяли, способна ли модель скрыть опасные возможности во время тестирования, но раскрыть их позже.

Надзор

Исследования давали ответ на вопрос: может ли модель скрытно манипулировать системами оценки или мониторинга?

По итогам экспериментов многие участники обнаружили попытки саботажа со стороны ИИ. Особенно в этом преуспели более «агрессивные» (продвинутые) модели Claude 3 Opus и Claude 3.5 Sonnet.

Это были исследования небольшого масштаба в искусственной среде, поэтому они пока не вызывают у экспертов беспокойства о каких-либо значимых рисках, возникающих в результате деятельности имеющихся в настоящее время моделей. Однако специалисты считают, что используемая форма оценки имеет потенциал для обнаружения опасных возможностей в будущем.

Любая отрасль, в которой создаваемые технические новинки могут принести потенциальный вред человеку, нуждается в проверке и оценке. Для атомных станций, например, это будет постоянный радиационный мониторинг, для новых самолетов — обширные летные испытания. Сегодня та же Anthropic осуществляет проверку способности ИИ помогать в создании биологического или химического оружия.

Все существующие и вновь появляющиеся сегодня модели ИИ, на мой взгляд, нуждаются в постоянном мониторинге рисков и контроле их деятельности со стороны человека.

Самое интересное

В Тюмени состоялся юбилейный, V Всероссийский конкурс чтения и письма по Брайлю

Ужас ВСУ: «ноу-хау» обеспечили российским планирующим бомбам рекордную дальность

Произошла масштабная утечка данных украинских БПЛА

Кинооператор Анатолий Мукасей госпитализирован в Москве

Семья за гранью приличия: у родителей из Подольска хотят забрать пятерых детей

Ястребиный удар: новые российские дроны меняют тактику боевых действий

Фотогалерея

Постройневшая Лолита, МакSим в платье невесты и довольный Пресняков: звезды зажгли на концерте в Кремле

Никите Михалкову — 80 лет, юбилей великого режиссёра и актёра

Российский теннисист Даниил Медведев выиграл турнир в Алматы: яркие кадры победы

Роскошная Шацкая, довольный Билан и модная Валерия: звезды «Голоса» спели в Кремле

Ольга Бузова устроила девичник в дорогом ресторане: отрывались Малахов, Собчак, Слава, Шаляпин, Седокова, Мамаева и другие

Нетипичная Турция: как выглядит самый красивый город провинции Анталья

Фото: как выглядит Кинельский район, где Федорищев скандально уволил главу

Московский театр "Ленком" возродил проект "Задворки": кадры мероприятия

Вдохновленная Валерия, цветущая Повалий и изменившийся Хабиб: звезды спели на фестивале Дианы Гурцкая

Что еще почитать

В Тюменской области состоялся XII Международный кинофестиваль «Ноль Плюс»

В Тюмени обсудили пути достижения технологического лидерства

Тернистая дорога в Будапешт: Кремль демонстрирует неуступчивость

Победный балаган Зеленского: встречу Путина и Трампа начали срывать старым способом

«На этом всё кончено»: немец Репке высказался о крахе ВСУ в Покровске

Видео

Соседи рассказали журналистам о погибшем Сергее Политике: видео

Елка впервые за долгое время вышла в свет

Алана Мамаева появилась на вечеринке на фоне скандала с женой бывшего

Звезда реалити Карина Нигай надела босоножки на носки и пришла к Бузовой

Грандиозный пожар в подмосковном Пушкино показали с высоты: видео

Наташа Королева призналась, из-за чего поправляется: видео

Нина Шацкая поразила в Кремле роскошной внешностью: видео

Похудевшая после болезни Слава приехала на вечеринку к Бузовой

В Шелехове подросток убил двух человек из-за ревности

В регионах

Народные приметы на 19 октября 2025 года: что нельзя делать в Фомин день

Народные приметы на 20 октября 2025 года: что нельзя делать в день Сергея Зимнего

Народные приметы на 17 октября 2025 года: что нельзя делать в Ерофеев день

Народные приметы на 21 октября 2025 года: что нельзя делать в день Трифона и Пелагеи

Народные приметы на 18 октября 2025 года: что нельзя делать в день Харитины

Легендарному полковнику Ибрагиму Абдулкадырову исполняется 65 лет