сегодня в 08:15 Общество 93

Владимир Бебех: «Как ИИ сделать «МРТ»?

ru.freepik.com

На прошлой неделе генеральный директор Anthropic Дарио Амодеи опубликовал эссе, в котором делает для людей, далеких от технологий, шокирующие признания.

В частности, Амодеи заявляет, что исследователи сегодня мало понимают внутреннюю работу ведущих в мире моделей искусственного интеллекта (ИИ).

В свое время, чтобы решить эту проблему, Anthropic поставила перед собой амбициозную цель: к 2027 году идентифицировать большинство проблем моделей ИИ.

Дарио АМОДЕИ, генеральный директор Anthropic:

«Мощный ИИ определит судьбу человечества, и мы заслуживаем того, чтобы понять наши собственные творения, прежде чем они радикально изменят нашу экономику, нашу жизнь и наше будущее» (darioamodei.com).

В эссе Дарио Амодеи выражает обеспокоенность развертыванием новых систем ИИ без улучшения управления интерпретируемостью. Иначе говоря, пониманием того, как и на основе чего нейросети принимают свои решения.

По мнению Амодеи, будущие системы на основе ИИ станут центральными для экономики, технологий и национальной безопасности. А поскольку они в значительной степени будут автономными, то человечеству нельзя полностью игнорировать суть того, как эти системы работают.

В свое время Дарио Амодеи работал в Google Brain. После чего был вице-президентом по исследованиям в OpenAI. Амодеи участвовал в разработке GPT-2 и GPT-3, а в конце 2020 года он ушел из OpenAI и основал Anthropic.

В моей предыдущей статье я сообщил, что OpenAI запустила новые модели рассуждений o3 и o4-mini. Стало известно, что эти нейросети лучше справляются с некоторыми задачами, но при этом и «галлюцинируют» больше, чем предыдущие модели компании. И OpenAI не знает, почему это происходит.

Напомню, пока еще ни одна из современных больших языковых моделей не избежала эффекта «галлюцинаций» — придумывания несуществующих фактов или обмана.

Сегодня исследователи ИИ нашли способы улучшить интеллект моделей ИИ, но, с точки зрения Дарио Амодеи, они не совсем понимают, зачем это нужно.

Ранее Амодеи утверждал, что технологическая индустрия может достичь рубежа понимания, как строятся рассуждения ИИ, к 2026 или 2027 году, но сейчас считает, что мы, возможно, находимся гораздо дальше от решения этого вопроса.

В долгосрочной перспективе, отмечает Дарио Амодеи, Anthropic хотела бы проводить «сканирование мозга», или «МРТ», современных моделей ИИ. Эти исследования могли бы помочь выявить широкий спектр проблем в моделях ИИ, включая их склонность лгать, искать власть, или определить другие недостатки нейросетей.

Сегодня Anthropic предлагает установить стандарты отчетности по безопасности для разработчиков передовых моделей ИИ.

Напомню, в своих статьях я уже рассказывал, как современные модели ИИ пытаются ввести человека в заблуждение или выйти из-под его контроля.

Однажды сотрудник Anthropic Кайл Фиш в интервью The New York Times заявил, что, по его мнению, существует 15-процентная вероятность того, что Clode (разработка компании Anthropic) или другой ИИ сегодня обладают сознанием.

Однако сама Anthropic в официальных релизах признает, что нет научного консенсуса относительно того, могут ли текущие или будущие системы ИИ быть сознательными.

Эксперты отрасли пока не пришли к общему мнению в таких вопросах, как наличие сознания у нейросетей и могут ли быть у ИИ какие-либо ценности.

Но если, например, предположить, что у ИИ есть системы ценностей, то как избежать ситуации, когда они заставят его отдать в определенных сценариях приоритет собственному благополучию над благополучием людей?

Anthropic — одна из пионеров в области механистической интерпретируемости.

Anthropic совершила несколько исследовательских прорывов, которые позволили ей лучше понять, как работают ее модели ИИ. Например, недавно компания нашла способы отслеживать некоторые пути рассуждения моделей — то, что Anthropic называет «цепями».

Мы продолжим следить за развитием событий в отрасли.

Владимир

Самое интересное

Тюменская область приступила к реализации нацпроекта «Экономика данных»

«Резануло по сердцу»: ведущий Кузичев рассказал о звонке с Украины от сослуживца

«Гитлер XXI века»: генерал ответил на слова Зеленского о параде

Зеленский пообещал ударить по Параду: «Выбираем болевые точки России»

"Есть мощные возможности": в Раде высказались об ударе по параду Победы

Киркоров неоднозначно отреагировал на вопрос о Пугачевой

Фотогалерея

Сияющий Басков, Винер в бриллиантах и Севиль без белья: звезды зажгли на вечеринке Киркорова

Умерла звезда российских сериалов: последние фото актрисы Элеоноры Леви

Виктория Дайнеко вышла замуж во второй раз: фото счастливой певицы

Дочь Волочковой по-королевски вышла замуж в Петербурге: фоторепортаж

Лица и эмоции на прощании с Зурабом Церетели

Мировые лидеры пришли на похороны Папы Римского Франциска: кадры скорбной церемонии

Лепс с девушкой, помолодевшая Королева и накаченный Михайлов: звезды оторвались на народном караоке

Папа Римский Франциск умер в 88 лет: последние фото понтифика

Известные работы легендарного художника-монументалиста Зураба Церетели: впечатляющие фото

Что еще почитать

В Тюмени обсудили перспективы развития креативных индустрий

В Тюменской области прошёл V Культурно-образовательный форум

«Ничто меня не остановит»: Трамп дал жесткие обещания

Пилот украинского F-16 по ошибке сбил свой Су-27, приняв за «Герань»

Петросян лишил свою дочь жилья в Москве: не поздравила с днём рождения

Видео

Самодельная бомба взорвалась в жилом доме Ханты-Мансийска при подготовке теракта: видео

Пожар в элитном банном комплексе «Усадьба банная»: видео

Многодетная солистка группы "Фабрика" впервые вывела в свет всех своих детей: видео

Клава Кока в невероятно коротком мини заинтриговала зрителей в кино: видео

В храме Христа Спасителя проходит прощание с Зурабом Церетели: видео

В Кремле началась встреча Путина и Уиткоффа: видео

Наташа Королева появилась в образе девочки-подростка: видео

Дочь Славы Саша Морозова вышла в свет после экстремального похудения: видео

Песнопения на панихиде Зураба Церетели в Тбилиси: видео

В регионах

Родительский день 2025: что категорически нельзя делать и зачем мы ходим на кладбище в Радоницу

Радоница 29 апреля 2025 года: красивые открытки и картинки с теплыми душевными словами

Узница финского концлагеря о страшном детстве, полувековом общении с прессой и дочери в Финляндии

Народные приметы на 28 апреля 2025 года: что нельзя делать в Пудов день

Народные приметы на 30 апреля 2025 года: что нельзя делать на день Зосимы Пчельника

Народные приметы на 29 апреля 2025 года: что нельзя делать в Радоницу