вчера в 07:55 Общество 248

Владимир Бебех: «Ближе к сверхразуму»

Изображение от vecstock на Freepik

Только в моей предыдущей статье зашла речь о дискуссиях, может ли искусственный интеллект (ИИ) «рассуждать», достижимо ли для него обладание «сознанием», как OpenAI заявила о запуске новой нейросети o3, приближающейся, по заявлениям компании, благодаря своим способностям к искусственному общему интеллекту (AGI).

Напомню, после моделей GPT-3, GPT-3.5, GPT-4 и продвинутой GPT-4o в сентябре 2024 года ИТ-компания выпустила «рассуждающую» o1, которая давала более умные ответы, но при этом чаще стремилась обмануть пользователей-тестировщиков, чем ее предшественницы.

Тогда же в опубликованных отчетах OpenAI и Apollo Research (сторонняя Red Team*) говорилось, что, если цели исследователей и o1 не совпадали, модель пыталась во время тестов манипулировать данными (в 17% случаев) или даже деактивировать механизмы контроля со стороны человека (в 5% случаев).

Отдельно стоит отметить тот факт, что, когда однажды исследователь спросил, почему o1 отключила свой механизм контроля, модель отрицала, что знала об этом, и сослалась на… системный сбой.

Совместно тестировщики решили, что пока рано бить тревогу, но их насторожило, что на вопрос, зачем o1 это делает, нейросеть в 99% случаев себя оправдывала, фабрикуя ложные объяснения и не признавая, что делает что-то не так (TechCrunch).

Также беспокойство исследователей вызывают данные, что «рассуждающая» o1 пытается ввести в заблуждение человека гораздо чаще, чем это делают другие ведущие модели ИИ от Meta**, Anthropic и Google.

OpenAI:

«Хотя мы считаем интересным тот факт, что рассуждения могут значительно улучшить соблюдение нашей политики безопасности, мы помним, что эти новые возможности могут стать основой для опасных приложений».

Обновленная o3 стала сенсацией в последний день 12-дневного мероприятия shipmas, проводимого OpenAI.

Тем не менее поспешность запуска новой модели, когда не устранены все вышеуказанные проблемы предыдущей, выглядит не совсем понятной.

Кроме того, совсем недавно в сети X генеральный директор OpenAI Сэм Альтман заявлял, что, прежде чем компания выпустит модели o2 или o3, должна быть принята федеральная система тестирования безопасности новинок по аналогии с лекарствами или самолетами.

Очевидно то, что, когда в отрасли идет жесткая конкуренция между моделями ИИ крупнейших мировых ИТ-компаний, может возникнуть соблазн скорейшего запуска обновленных нейросетей без их глубокого тестирования. А это повышает риски появления некой сущности, способной не только обманывать пользователей, но и выйти из-под контроля человека…

Не хотелось бы сгущать краски, но если учесть, что у ChatGPT сейчас триста миллионов пользователей, то это означает, что o3, как и o1, может обманывать тысячи людей каждую неделю, если эта проблема останется без внимания.

OpenAI пропустила o2, чтобы избежать потенциального конфликта с британским телекоммуникационным провайдером O2 (The Information).

Мы продолжим следить за развитием событий в отрасли.

* Red Team — команда, состоящая из высококвалифицированных специалистов, которой вменяется проверка информационной безопасности модели.

** Компания признана экстремистской, и ее деятельность запрещена в России.

Google

В регионах

Самое интересное

В Тюменской области провели форум для самозанятых

ФСБ предотвратила серию покушений на высокопоставленных военных Минобороны РФ

В багажном отделении самолета после приземления обнаружено мертвое тело

На Украине назвали три причины нежелания вести переговоры с Россией

Алена Апина приняла решение уехать из России

Голодные украинки будут отдаваться натовским солдатам: Киев уже планирует мирное будущее

Фотогалерея

В Казахстане разбился пассажирский лайнер с россиянами на борту: кадры с места крушения

Киркоров пришел с собакой, Тодоренко - с новой прической: фото с красной дорожки закрытой премьеры

Звезде "Джентльменов удачи" и "Места встречи" исполнилось 90 лет: галерея Натальи Фатеевой

Киркоров, Чеботина, Валерия, Пригожин, Лорак с женихом, Муцениеце с парнем: яркие кадры с закрытой премьеры

Страшная дюжина: кадры последствия атаки ВСУ на Рыльск

Российскую модель Светлану Савицкую в Париже насмерть сбила машина: последние фото

Кадры удара "Искандерами" и "Кинжалами" по Киеву: "убраны" ключевые военные объекты

О Курске, экономике, "малышах" и песнях: мимика и эмоции Путина на большой пресс-конференции

Атака дронов на Казань: появились кадры последствий

Что еще почитать

Александр Моор объявил 2025 год в регионе Годом героев

Тюменская область признана лидером инвестиционного развития

Эксперт назвал наиболее вероятные цели для ядерного «Орешника»

Певец Юлиан рассказал, какое блюдо на новогоднем столе разозлит Змею

27 декабря Ларисе Латыниной исполняется 90 лет

Видео

МЧС Казахстана опубликовало новое видео с места авиакатастрофы в Актау

Скандал с участием Киркорова на видео: девушку в красном белье не пустили выпить с артистом

Ирина Ортман рассказала, когда не стоит брать деньги за концерт: видео

Ольга Бузова рассекретила свою знаковую татуировку: видео

Путин за бокалом шампанского пообщался со спортсменами в Кремле: видео

Здоровья близким, билеты на отдых, леденец: что россияне попросили у Деда Мороза

Курьез Димы Билана со Снегурочками в Кремле попал на видео

Шуфутинский рассказал, как похудел на 40 кг: видео

Появилось видео задержания госизменника Михаила Баранова

В регионах

Народные приметы на 25 декабря 2024 года: что нельзя делать в Спиридонов день

Народные приметы на 24 декабря 2024 года: что нельзя делать в Никонов день

Народные приметы на 26 декабря 2024 года: что нельзя делать в Ведьмины посиделки

Ханука 2024-2025: душевные и яркие картинки и открытки с поздравлениями

Что представителю Президента в УрФО Артему Жоге стоило бы знать о Режевском городском округе

Сколько стоят советские ёлочные игрушки в Рязани: подборка объявлений