Grok 4：马斯克20万GPU打造的"最聪明"AI模型

Содержание Подробности

В мире, где технологии и знания переплетаются друг с другом, каждое чтение похоже на удивительное приключение, которое дает вам ощущение мудрости и вдохновляет на бесконечное творчество.

Grok 4: самая "умная" модель искусственного интеллекта Маска, построенная на 200 000 графических процессорах

10 июля по пекинскому времени, после часа ожидания, Маск наконец раскрыл тайну новейшего шедевра xAI - Grok 4, который Маск назвал "самым умным в мире ИИ". Эта модель, которую Маск назвал "самым умным в мире ИИ", сразу после выхода установила новые рекорды в основных бенчмарк-тестах и стала первой моделью ИИ, преодолевшей отметку точности 50% в "последнем экзамене человека" (HLE).

Арифметическая шкала: беспрецедентное количество учебных материалов

Масштабы обучения Grok 4 отражают огромные инвестиции xAI в инфраструктуру ИИ с беспрецедентным уровнем распределения вычислительных мощностей:

Конфигурация инфраструктуры

Конфигурация оборудования	Технические характеристики	Распределение использования
Кластеры для предварительного обучения	100 000 графических процессоров H100	Обучение базовым моделям
Кластер расширенного обучения	200 000 листов смеси H100/A100	Тонкая настройка RL и оптимизация выводов
общая вычислительная мощность (TCP)	Суперкомпьютерный центр "Колосс	Полноценное обучение искусственному интеллекту
соотношение продолжительности обучения	В 100 раз лучше, чем Grok 2	Итерация глубокого обучения
Коэффициент расчета RL	10-кратное улучшение по сравнению с Grok 3	Специализированный для интенсивного обучения

Маск рассказал, что xAI вкладывает в обучение с подкреплением почти столько же арифметики, сколько в предварительное обучение, - такой подход к обучению, основанный на "двух двигателях", крайне редок в индустрии. Команда обучила модель думать, рассуждать и самокорректироваться на основе первых принципов, что является основным источником способности серии Grok к рассуждениям.

Эволюция архитектуры обучения

Парадигма обучения семейства Grok претерпела значительную эволюцию:

версия модели	Основные технологические парадигмы	Распределение вычислительных ресурсов	Основные прорывы
Грок 2	Предсказание следующего жетона	Основное внимание уделяется базовой предварительной подготовке	Увеличение масштаба
Грок 3	Предварительное обучение + предварительная RL	10-кратное увеличение арифметических навыков до обучения	Введение навыков рассуждения
Грок 4	Слияние родных инструментов + крупномасштабный RL	Арифметика RL увеличилась еще в 10 раз	Использование инструментов и мультиинтеллектуальность

Основная технологическая архитектура: инновационный дизайн для интеграции

Механизм обучения интеграции инструментов

Самым большим технологическим новшеством Grok 4 является интеграция возможностей использования инструментов непосредственно в процесс обучения, а не традиционный подход "после интеграции":

Технические характеристики	Традиционные программы	Программа Grok 4	повышение производительности
Метод вызова инструмента	Интеграция Post API	Интеграция родного обучения	Повышение эффективности в 3-5 раз
кривая обучения	Период резкой адаптации	плавный рост	Лучшая согласованность
масштабируемость	ограниченный интерфейсом	бесшовная интеграция	Поддержка сложных цепочек инструментов
последовательность рассуждений	с лёгкими ошибками	Сплошная оптимизация	Снижение коэффициента ошибок 40%

Такая конструкция позволяет Grok 4 изучать, когда, как и зачем использовать конкретные инструменты во время обучения, а не просто вызывать внешние API.

Мультиразведывательная система взаимодействия

Grok 4 Heavy использует параллельный режим работы с несколькими интеллектами и имеет следующие технические характеристики:

Параметры совместной работы	техническая спецификация	Рабочие механизмы
Количество параллельных интеллектов	До 32	Одновременное лечение одной и той же проблемы
Стратегии ветвления в рассуждениях	дерево глубокого поиска	Каждая ветвь исследуется независимо
Механизмы совместной проверки	Алгоритмы перекрестной валидации	Межведомственная проверка
выбор оптимального решения	Интегрированное обучение Fusion	Генерация глобальных оптимальных ответов
Расчет расширений во время тестирования	Регулируется от 1× до 32×	Динамически подстраивается под сложность задачи

Эта "команда аспирантов, работающих в группах", увеличила точность 40% до более чем 50% для индивидуальных интеллектов.

Параметры работы модели

Основные показатели	Технические характеристики Grok 4	Сравнение отраслей
Длина контекста	256K токенов	Стандарты корпоративных приложений
Номер версии API	grok-4-0709	Последняя стабильная версия
скорость мышления	75 жетонов/секунду	За Клодом 4 Опус (66 жетонов/секунду)
Оптимизация задержки	Сокращение вдвое	Голосовое взаимодействие в режиме реального времени
одновременная обработка	Поддержка многопользовательского режима с высокой степенью параллелизма	Готовность к коммерциализации
эпоха моделирования	Инфраструктура 7-го поколения	Новейший стек технологий xAI

Бенчмаркинг производительности: ведущий интеллект во всем мире

Академические навыки и навыки рассуждения

Grok 4 доказывает свой "постдокторский уровень" интеллекта, участвуя в самых престижных тестах:

Категория испытаний	Конкретные контрольные показатели	Оценка Grok 4	Grok 4 Heavy	Сравнение уровней докторской степени для людей
общая тема	HLE (Human Legacy Examination)	38.6%	44.4%	Больше, чем большинство аспирантов
математический конкурс	AIME25	100%	100%	уровень полной отметки
Команда по математике	HMMT25	96.7%	96.7%	Высший уровень соревнований
Вопросы и ответы аспирантов	GPQA	88.9%	88.9%	Докторантура начального уровня
олимпиада по математике	USAMO25	61.9%	61.9%	Международный уровень соревнований
конкурс программистов	LCB (январь-май)	79.4%	79.4%	Уровень профессионального программиста

Оценка основных компетенций AGI

Grok 4 также преуспел в ключевом тесте General AI:

Предметы теста AGI	Производительность Grok 4	техническое значение	Сравнение с конкурентами
ARC-AGI-2	15.9%	Первая коммерческая модель, разбившая 10%	В 12 раз выше, чем у DeepSeek R1
ARC-AGI-1	66.7%	Способность обобщать известные закономерности	Превзошел GPT-4 почти на 6 процентных пунктов
коэффициент экономической эффективности	оптимальный	Самый умный в пересчете на доллар	Лучшее в отрасли соотношение цены и качества

Специальные сценарии испытаний

В ряде уникальных тестовых сценариев Grok 4 продемонстрировал способность превзойти традиционный ИИ:

тестовый сценарий	конкретное выражение	Технические последствия
Бизнес-тест с вендинговым стендом	Чистая стоимость в два раза больше, чем у второго места	Способность принимать долгосрочные бизнес-решения
RKG Drug Discovery	Единственная модель, которая разбила 10%	биомедицинские рассуждения
Сложное физическое моделирование	Успешное моделирование столкновений черных дыр	Развитые навыки научных вычислений

Стратегия ценообразования и коммерциализации

У xAI есть четкая стратегия позиционирования Grok 4 на высоком уровне:

уровень обслуживания	Ежемесячное ценообразование	Цены на годовую плату	Основные функциональные различия
SuperGrok	$30	$300	Одноместный интеллектуальный кузов Стандартная версия
SuperGrok Heavy	$300	$3,000.	Мультиинтеллектуальное издание для совместной работы

Такая ценовая стратегия позиционирует Grok 4 как высококлассный сервис искусственного интеллекта для корпоративных и профессиональных пользователей: годовая плата за Heavy-версию составляет до 21 500 китайских юаней.

Перспективы применения и интеграция в промышленность

Grok 4 будет быстро интегрирован в промышленную экосистему Маска: голосовой помощник был интегрирован в последнюю прошивку Tesla, а робот Optimus будет оснащен Grok как мозгом ИИ. xAI планирует выпустить специальные модели программирования, мультимодальные агенты и крупномасштабные модели генерации видео один за другим в течение следующих нескольких месяцев, чтобы создать полную матрицу продуктов ИИ.

Grok 4 занял лидирующие позиции в соревнованиях по искусственному интеллекту благодаря преимуществу в вычислительной мощности 200 000 кластеров GPU и технологическим инновациям в виде слияния нативных инструментов. Его ошеломляющая производительность в бенчмарках, особенно в сложных задачах, требующих глубоких рассуждений, знаменует собой значительный шаг на пути к "сверхчеловеческому интеллекту". Хотя высокая цена ограничивает его популярность, Grok 4 предлагает самый мощный вариант на рынке для профессиональных пользователей, стремящихся к максимальной мощности ИИ.

Если вы хотите использовать официальный платный эксклюзивный аккаунт GPT Plus, Claude Pro, Grok Super, вы можете связаться с нашей профессиональной командой (wx: f15303420735), если вы не знаете, как пополнить счет.

Для получения дополнительной продукции, пожалуйста, ознакомьтесь с	См. подробнее
ShirtAI - проникающий интеллект	Большая модель AIGC: начало эры двойной революции в инженерном деле и науке - Проникающая разведка
1:1 Восстановление Клода и GPT Официальный сайт - AI Cloud Native	Приложение для просмотра прямых трансляций матчей Global HD Sports Viewing Player (рекомендуется) - Blueshirt Technology
Транзитный сервис на основе официального API - GPTMeta API	Помогите, может ли кто-нибудь из вас дать несколько советов о том, как задавать вопросы в GPT? - знание
Глобальный цифровой магазин виртуальных товаров - Global SmarTone (Feng Ling Ge)	Насколько мощной является функция Claude airtfacts, что GPT мгновенно перестает хорошо пахнуть? -BeepBeep

категории.

Информационный бюллетень

рекламное пространство

Станьте свидетелями супермагии искусственного интеллекта вместе!

Примите в свои объятия помощника с искусственным интеллектом и повысьте свою производительность одним щелчком мыши!