Меню
По вопросам совместных проектов editor@huxley.media
По вопросам сотрудничества c авторами chiefeditor@huxley.media
Телефон

РЕВОЛЮЦИЯ В ИИ: о чем не писали в газетах

Huxley
Автор: Huxley
© Huxley — альманах о философии, бизнесе, искусстве и науке
РЕВОЛЮЦИЯ В ИИ: о чем не писали в газетах
Художественная иллюстрация искусственного интеллекта (ИИ). Это изображение показывает, как мультимодальные модели воспринимают ввод пользователя и генерируют вывод. Оно было создано Bakken & Baeck в рамках проекта Visualising AI, запущенного Google DeepMind / Photo by Google DeepMind on Unsplash

 

Текущий год обещает стать свидетелем не только множества достижений, но и самых настоящих сражений в области разработок искусственного интеллекта. За информационным ажиотажем можно легко не заметить того, что исподволь меняет наш мир.

К сожалению, далеко не сразу и далеко не все исследования и инновации в области ИИ становятся достоянием широкой общественности. Например, почти незаметным для СМИ оказалось создание большой языковой модели, для обучения которой не нужны огромные массивы реальных данных.

 

МИЛЛИАРДЫ ДЛЯ STARGATE

 

Не успел 2025 год начаться, а многие эксперты уже характеризуют его как определяющий для развития технологий искусственного интеллекта.

Буквально через день после вступления в должность президент США Дональд Трамп объявил о старте Stargate — широкого международного проекта, в котором примут участие ведущие технологические и финансовые компании из США, Японии и Объединенных Арабских Эмиратов.

На совместные исследования эти страны выделили колоссальную сумму — 500 миллиардов долларов США. Основная часть этих средств пойдет на развитие американской инфраструктуры ИИ.

 

DEEPSEEK: «ПРОДВИНУТЫЙ И ДЕШЕВЫЙ»

 

Было это простым совпадением или нет, но буквально на следующий день после сообщения о запуске Stargate китайская компания из Ханчжоу, специализирующаяся на исследовании искусственного интеллекта, объявила о рождении DeepSeek — новой большой языковой модели (LLM).

Компания продемонстрировала, что для значительного прорыва в этой области могут не понадобиться такие огромные суммы, которые были привлечены в Stargate. В ранних тестах производительность DeepSeek при выполнении задач по химии и математике соответствовала производительности o1 LLM от американской компании OpenAI. Однако версия DeepSeek-R1 оказалась уже способна выполнять пошаговые задачи, аналогичные человеческому мышлению.

Причем добиться этого китайским разработчикам удалось не только «за копейки», но и задействуя довольно скромные вычислительные мощности уже существующих LLM. Новость о «дешевом, но продвинутом» ИИ отправила в крутое пике котировки акций некоторых технологических компаний.

 

РЕВОЛЮЦИЯ, КОТОРУЮ НЕ ЗАМЕТИЛИ

 

Существуют разные видения ИИ, которые, вероятно, будут определять его развитие в будущем. Важные исследования, новые данные и планы в этой области продолжают публиковаться. Однако далеко не все они попадают в заголовки изданий. Хотя на самом деле заслуживают самой широкой общественной дискуссии.

Об одной из таких прорывных работ уже рассказывал в начале текущего года международный научный журнал Nature. Но в тени политически ангажированного информационного мейнстрима новость прошла незамеченной ведущими СМИ.

Речь идет о «точных прогнозах на основе малых данных с табличной моделью фундамента». По словам одного из рецензентов этой разработки, Дункана МакЭлфреша, инженера по данным в Stanford Health Care, новая технология может стать революционной для науки о данных.

 

Вступая в клуб друзей Huxley, Вы поддерживаете философию, науку и искусство

 

ОБУЧЕНИЕ НА «СИНТЕТИЧЕСКИХ ДАННЫХ»

 

Самые известные LLM предварительно обучены на сотнях миллиардов примеров реальных данных, таких как текст и изображения. Это позволяет им отвечать на запросы пользователей с определенной степенью надежности. Но что, если у вас реальные данные в требуемых количествах отсутствуют? Можно ли научить ИИ давать надежные ответы на меньшем количестве наборов данных?

Это ключевая проблема для исследователей, которые используют ИИ для прогнозирования на основе табличных наборов данных — их даже близко нет в необходимом для обучения моделей количестве. Однако ученые нашли возможность достичь надежных результатов, обучая модели ИИ не на реальных, а на случайно сгенерированных «синтетических данных», которые имитируют статистические свойства данных реальных.

 

РЕАЛЬНЫЙ МИР БОЛЬШЕ НЕ НУЖЕН?

 

Авторы этой разработки — компьютерные ученые Ной Холлман, Самуэль Мюллер и Франк Хуттер из германского Университета Фрайбурга. Их модель называется TabPFN и предназначена для анализа табличных данных. Например, таких, которые содержатся в электронных таблицах.

Обычно пользователь создает их, заполняя строки и столбцы данными. На их основе, используя математические модели, он делает выводы или проекции. TabPFN может совершать прогнозы на основе любого, даже самого незначительного набора данных. Начиная от тех, которые используются в бухгалтерском учете и финансах, и заканчивая данными, которые применяют в геномике и нейронауке.

Самое удивительное, что прогнозы модели оказываются точны, несмотря на то, что она обучается без данных из реального мира. Их ей заменяют 100 миллионов случайно сгенерированных наборов данных. Получается, что относительную полноту реальности она способна восстанавливать по «фрагменту».

 

КАК ВЗЛОМАТЬ «ЧЕРНЫЙ ЯЩИК»?

 

Конечно, эта модель, так же, как и все остальные, не застрахована от неточных результатов или галлюцинаций. Синтетические данные не лишены рисков, поэтому важно, чтобы исследования в этой области были воспроизводимы. Это покажет пользователям, что полученным результатам можно доверять.

Работа Холлмана и его коллег является примером того, как необходимость стимулирует инновации: исследователи поняли, что для обучения их модели недостаточно доступных наборов данных из реального мира. И тогда они нашли альтернативный подход.

Остается фактом, что все модели ИИ, независимо от того, обучены ли они на синтетических или реальных данных, по-прежнему остаются своего рода «черными ящиками». Пользователи и регулирующие органы понятия не имеют, как достигается результат.

2025 год обещает нам захватывающие разработки, давайте не будем забывать об исследованиях, которые призваны понять, как работает ИИ, а также о методических статьях. Они так же важны, как и публикации, объявляющие о прорывах.

 

Оригинальное исследование:

 


При копировании материалов размещайте активную ссылку на www.huxley.media
Нашли ошибку?
Выделите текст и нажмите Ctrl + Enter