10 июля по пекинскому времени, после часа ожидания, Маск наконец раскрыл тайну новейшего шедевра xAI - Grok 4, который Маск назвал "самым умным в мире ИИ". Эта модель, которую Маск назвал "самым умным в мире ИИ", сразу после выхода установила новые рекорды в основных бенчмарк-тестах и стала первой моделью ИИ, преодолевшей отметку точности 50% в "последнем экзамене человека" (HLE).

Арифметическая шкала: беспрецедентное количество учебных материалов
Масштабы обучения Grok 4 отражают огромные инвестиции xAI в инфраструктуру ИИ с беспрецедентным уровнем распределения вычислительных мощностей:
Конфигурация инфраструктуры
Конфигурация оборудования | Технические характеристики | Распределение использования |
---|---|---|
Кластеры для предварительного обучения | 100 000 графических процессоров H100 | Обучение базовым моделям |
Кластер расширенного обучения | 200 000 листов смеси H100/A100 | Тонкая настройка RL и оптимизация выводов |
общая вычислительная мощность (TCP) | Суперкомпьютерный центр "Колосс | Полноценное обучение искусственному интеллекту |
соотношение продолжительности обучения | В 100 раз лучше, чем Grok 2 | Итерация глубокого обучения |
Коэффициент расчета RL | 10-кратное улучшение по сравнению с Grok 3 | Специализированный для интенсивного обучения |
Маск рассказал, что xAI вкладывает в обучение с подкреплением почти столько же арифметики, сколько в предварительное обучение, - такой подход к обучению, основанный на "двух двигателях", крайне редок в индустрии. Команда обучила модель думать, рассуждать и самокорректироваться на основе первых принципов, что является основным источником способности серии Grok к рассуждениям.

Эволюция архитектуры обучения
Парадигма обучения семейства Grok претерпела значительную эволюцию:
версия модели | Основные технологические парадигмы | Распределение вычислительных ресурсов | Основные прорывы |
---|---|---|---|
Грок 2 | Предсказание следующего жетона | Основное внимание уделяется базовой предварительной подготовке | Увеличение масштаба |
Грок 3 | Предварительное обучение + предварительная RL | 10-кратное увеличение арифметических навыков до обучения | Введение навыков рассуждения |
Грок 4 | Слияние родных инструментов + крупномасштабный RL | Арифметика RL увеличилась еще в 10 раз | Использование инструментов и мультиинтеллектуальность |

Основная технологическая архитектура: инновационный дизайн для интеграции
Механизм обучения интеграции инструментов
Самым большим технологическим новшеством Grok 4 является интеграция возможностей использования инструментов непосредственно в процесс обучения, а не традиционный подход "после интеграции":
Технические характеристики | Традиционные программы | Программа Grok 4 | повышение производительности |
---|---|---|---|
Метод вызова инструмента | Интеграция Post API | Интеграция родного обучения | Повышение эффективности в 3-5 раз |
кривая обучения | Период резкой адаптации | плавный рост | Лучшая согласованность |
масштабируемость | ограниченный интерфейсом | бесшовная интеграция | Поддержка сложных цепочек инструментов |
последовательность рассуждений | с лёгкими ошибками | Сплошная оптимизация | Снижение коэффициента ошибок 40% |
Такая конструкция позволяет Grok 4 изучать, когда, как и зачем использовать конкретные инструменты во время обучения, а не просто вызывать внешние API.
Мультиразведывательная система взаимодействия
Grok 4 Heavy использует параллельный режим работы с несколькими интеллектами и имеет следующие технические характеристики:
Параметры совместной работы | техническая спецификация | Рабочие механизмы |
---|---|---|
Количество параллельных интеллектов | До 32 | Одновременное лечение одной и той же проблемы |
Стратегии ветвления в рассуждениях | дерево глубокого поиска | Каждая ветвь исследуется независимо |
Механизмы совместной проверки | Алгоритмы перекрестной валидации | Межведомственная проверка |
выбор оптимального решения | Интегрированное обучение Fusion | Генерация глобальных оптимальных ответов |
Расчет расширений во время тестирования | Регулируется от 1× до 32× | Динамически подстраивается под сложность задачи |
Эта "команда аспирантов, работающих в группах", увеличила точность 40% до более чем 50% для индивидуальных интеллектов.

Параметры работы модели
Основные показатели | Технические характеристики Grok 4 | Сравнение отраслей |
---|---|---|
Длина контекста | 256K токенов | Стандарты корпоративных приложений |
Номер версии API | grok-4-0709 | Последняя стабильная версия |
скорость мышления | 75 жетонов/секунду | За Клодом 4 Опус (66 жетонов/секунду) |
Оптимизация задержки | Сокращение вдвое | Голосовое взаимодействие в режиме реального времени |
одновременная обработка | Поддержка многопользовательского режима с высокой степенью параллелизма | Готовность к коммерциализации |
эпоха моделирования | Инфраструктура 7-го поколения | Новейший стек технологий xAI |


Бенчмаркинг производительности: ведущий интеллект во всем мире
Академические навыки и навыки рассуждения
Grok 4 доказывает свой "постдокторский уровень" интеллекта, участвуя в самых престижных тестах:
Категория испытаний | Конкретные контрольные показатели | Оценка Grok 4 | Grok 4 Heavy | Сравнение уровней докторской степени для людей |
---|---|---|---|---|
общая тема | HLE (Human Legacy Examination) | 38.6% | 44.4% | Больше, чем большинство аспирантов |
математический конкурс | AIME25 | 100% | 100% | уровень полной отметки |
Команда по математике | HMMT25 | 96.7% | 96.7% | Высший уровень соревнований |
Вопросы и ответы аспирантов | GPQA | 88.9% | 88.9% | Докторантура начального уровня |
олимпиада по математике | USAMO25 | 61.9% | 61.9% | Международный уровень соревнований |
конкурс программистов | LCB (январь-май) | 79.4% | 79.4% | Уровень профессионального программиста |

Оценка основных компетенций AGI
Grok 4 также преуспел в ключевом тесте General AI:
Предметы теста AGI | Производительность Grok 4 | техническое значение | Сравнение с конкурентами |
---|---|---|---|
ARC-AGI-2 | 15.9% | Первая коммерческая модель, разбившая 10% | В 12 раз выше, чем у DeepSeek R1 |
ARC-AGI-1 | 66.7% | Способность обобщать известные закономерности | Превзошел GPT-4 почти на 6 процентных пунктов |
коэффициент экономической эффективности | оптимальный | Самый умный в пересчете на доллар | Лучшее в отрасли соотношение цены и качества |

Специальные сценарии испытаний
В ряде уникальных тестовых сценариев Grok 4 продемонстрировал способность превзойти традиционный ИИ:
тестовый сценарий | конкретное выражение | Технические последствия |
---|---|---|
Бизнес-тест с вендинговым стендом | Чистая стоимость в два раза больше, чем у второго места | Способность принимать долгосрочные бизнес-решения |
RKG Drug Discovery | Единственная модель, которая разбила 10% | биомедицинские рассуждения |
Сложное физическое моделирование | Успешное моделирование столкновений черных дыр | Развитые навыки научных вычислений |

Стратегия ценообразования и коммерциализации
У xAI есть четкая стратегия позиционирования Grok 4 на высоком уровне:
уровень обслуживания | Ежемесячное ценообразование | Цены на годовую плату | Основные функциональные различия |
---|---|---|---|
SuperGrok | $30 | $300 | Одноместный интеллектуальный кузов Стандартная версия |
SuperGrok Heavy | $300 | $3,000. | Мультиинтеллектуальное издание для совместной работы |
Такая ценовая стратегия позиционирует Grok 4 как высококлассный сервис искусственного интеллекта для корпоративных и профессиональных пользователей: годовая плата за Heavy-версию составляет до 21 500 китайских юаней.

Перспективы применения и интеграция в промышленность
Grok 4 будет быстро интегрирован в промышленную экосистему Маска: голосовой помощник был интегрирован в последнюю прошивку Tesla, а робот Optimus будет оснащен Grok как мозгом ИИ. xAI планирует выпустить специальные модели программирования, мультимодальные агенты и крупномасштабные модели генерации видео один за другим в течение следующих нескольких месяцев, чтобы создать полную матрицу продуктов ИИ.
Grok 4 занял лидирующие позиции в соревнованиях по искусственному интеллекту благодаря преимуществу в вычислительной мощности 200 000 кластеров GPU и технологическим инновациям в виде слияния нативных инструментов. Его ошеломляющая производительность в бенчмарках, особенно в сложных задачах, требующих глубоких рассуждений, знаменует собой значительный шаг на пути к "сверхчеловеческому интеллекту". Хотя высокая цена ограничивает его популярность, Grok 4 предлагает самый мощный вариант на рынке для профессиональных пользователей, стремящихся к максимальной мощности ИИ.

Если вы хотите использовать официальный платный эксклюзивный аккаунт GPT Plus, Claude Pro, Grok Super, вы можете связаться с нашей профессиональной командой (wx: f15303420735), если вы не знаете, как пополнить счет.