Согласно новому анализу некоммерческого исследовательского института Epoch AI, индустрия искусственного интеллекта может столкнуться с замедлением роста производительности моделей рассуждений (reasoning models) уже в ближайшие годы. В частности, прогресс в этой области рискует достичь предела к 2026 году, несмотря на активные инвестиции и увеличение вычислительных мощностей.
Обучение с подкреплением — главный драйвер прогресса
Эти модели создаются в два этапа:
1. Базовое обучение на огромных массивах данных.
2. Обучение с подкреплением (RL) — метод, при котором модель получает «обратную связь» для улучшения решений.
До недавнего времени компании вроде OpenAI не использовали масштабные вычисления на этапе RL. Но теперь ситуация меняется:
• Для o3 OpenAI применила в 10 раз больше вычислительных ресурсов, чем для предыдущей версии.
• Компания планирует ещё больше увеличить мощность RL-обучения в будущих моделях.
Однако, как отмечает Epoch AI, существует предел того, насколько RL можно масштабировать.
Почему модели рассуждений так важны?
Модели рассуждений, такие как OpenAI o3, демонстрируют впечатляющие результаты в сложных задачах — от математики до программирования. Их ключевое отличие от стандартных ИИ — способность глубже анализировать проблемы, применяя больше вычислений. Однако за это приходится платить: такие модели работают медленнее и требуют значительно больше ресурсов.Обучение с подкреплением — главный драйвер прогресса
Эти модели создаются в два этапа:
1. Базовое обучение на огромных массивах данных.
2. Обучение с подкреплением (RL) — метод, при котором модель получает «обратную связь» для улучшения решений.
До недавнего времени компании вроде OpenAI не использовали масштабные вычисления на этапе RL. Но теперь ситуация меняется:
• Для o3 OpenAI применила в 10 раз больше вычислительных ресурсов, чем для предыдущей версии.
• Компания планирует ещё больше увеличить мощность RL-обучения в будущих моделях.
Однако, как отмечает Epoch AI, существует предел того, насколько RL можно масштабировать.
Когда прогресс замедлится?
Согласно Джошу Ю, аналитику Epoch AI:- Производительность стандартного обучения ИИ растёт в 4 раза в год.
- RL даёт 10-кратный прирост каждые 3–5 месяцев.
Другие проблемы масштабирования
Помимо вычислительных сложностей, Epoch AI выделяет:- Высокие исследовательские затраты — если RL требует постоянных вложений, масштабирование станет нерентабельным.
- Галлюцинации — модели рассуждений чаще ошибаются по сравнению с обычными ИИ.
Что это значит для индустрии?
Если прогнозы Epoch AI верны, компании, вкладывающие миллиарды в reasoning-модели (OpenAI, DeepMind, Anthropic и др.), могут столкнуться с замедлением прогресса. Это заставит искать новые подходы к обучению ИИ, выходящие за рамки простого увеличения вычислений.«Быстрое масштабирование вычислений — ключевой фактор прогресса, но его одного может быть недостаточно», — заключает Джош Ю.Подробнее с исследованием можно ознакомиться на сайте Epoch AI https://epoch.ai/gradient-updates/how-far-can-reasoning-models-scale