
Китайская инициатива: ИИ-батальоны как ответ на угрозы со стороны США.
Китай использует прорыв в области вычислительных технологий от компании DeepSeek для повышения своих позиций в сфере ИИ.
Недавний анализ результатов торговой войны между Китаем и США показал, что отставание Китая в области ИИ с мая 2023 по октябрь 2024 сократилось в 30 раз. Однако для того, чтобы перейти от догоняющей позиции к лидерству, требовался удачный прорыв. Конкуренты, такие как OpenAI, Google и Anthropic, значительно ускорили свои разработки, в то время как США усилили экспортные ограничения для Китая.
Такой прорыв и произошел. Он связан с революционными достижениями китайских ИИ-моделей от DeepSeek, которые изменили базовые принципы вычислительной мощности для ИИ-систем. Старая парадигма, основанная на обучении, была заменена на новую, основанную на выводе.
• Ранее соотношение ресурсов для обучения и вывода моделей составляло от 70/30 до 80/20.
• В новой парадигме DeepSeek установил соотношение на уровне 25/75, что подразумевает использование большинства ресурсов при ответах на запросы пользователей.
Ключевым аспектом прорыва компании DeepSeek стало изменение требований к архитектуре вычислительных кластеров: с акцента на кластерах стоимостью в сотни миллиардов долларов на распределенную архитектуру.
Пример применения новых моделей демонстрируется в отчете Qbit AI. Поставщики распределенных облачных вычислений, такие как PPIO, запускают ИИ-услуги через сети, используя более 3900 узлов в 1200 городах Китая с общей вычислительной мощностью более 1000 петафлопс.
На момент китайского Нового года PPIO достигла 99,9% доступности своих услуг DeepSeek, и среднесуточное потребление токенов платформы стало больше 130 миллиардов.
На март 2025 года:
OpenAI обрабатывает около 1 трлн токенов в день, используя 2000–4000 петафлопс.
Baidu также обрабатывает порядка 1 трлн токенов, задействуя 1500–2300 петафлопс.
Для сравнения, российские модели имеют следующие показатели:
Яндекс (YaLM): ~5 млрд токенов в день, 1-3 петафлопса.
Сбер (GigaChat): ~5+ млрд токенов при 1-5 петафлопс.
Подводя итог: Новая стратегия Китая, основанная на больших батальонах распределенных вычислений, будет способствовать его конкурентным преимуществам. В то же время, классическая идея о том, что успех приходит к более мощным силам, подвергается сомнению. Как выразил Вольтер, успех принадлежит не к большим армиям, а к тем, кто лучше подготовлен.
Источник: @theworldisnoteasy