Содержание Подробности

В мире, где технологии и знания переплетаются друг с другом, каждое чтение похоже на удивительное приключение, которое дает вам ощущение мудрости и вдохновляет на бесконечное творчество.

Grok 4: самая "умная" модель искусственного интеллекта Маска, построенная на 200 000 графических процессорах

10 июля по пекинскому времени, после часа ожидания, Маск наконец раскрыл тайну новейшего шедевра xAI - Grok 4, который Маск назвал "самым умным в мире ИИ". Эта модель, которую Маск назвал "самым умным в мире ИИ", сразу после выхода установила новые рекорды в основных бенчмарк-тестах и стала первой моделью ИИ, преодолевшей отметку точности 50% в "последнем экзамене человека" (HLE).

Арифметическая шкала: беспрецедентное количество учебных материалов

Масштабы обучения Grok 4 отражают огромные инвестиции xAI в инфраструктуру ИИ с беспрецедентным уровнем распределения вычислительных мощностей:

Конфигурация инфраструктуры

Конфигурация оборудованияТехнические характеристикиРаспределение использования
Кластеры для предварительного обучения100 000 графических процессоров H100Обучение базовым моделям
Кластер расширенного обучения200 000 листов смеси H100/A100Тонкая настройка RL и оптимизация выводов
общая вычислительная мощность (TCP)Суперкомпьютерный центр "КолоссПолноценное обучение искусственному интеллекту
соотношение продолжительности обученияВ 100 раз лучше, чем Grok 2Итерация глубокого обучения
Коэффициент расчета RL10-кратное улучшение по сравнению с Grok 3Специализированный для интенсивного обучения

Маск рассказал, что xAI вкладывает в обучение с подкреплением почти столько же арифметики, сколько в предварительное обучение, - такой подход к обучению, основанный на "двух двигателях", крайне редок в индустрии. Команда обучила модель думать, рассуждать и самокорректироваться на основе первых принципов, что является основным источником способности серии Grok к рассуждениям.

Эволюция архитектуры обучения

Парадигма обучения семейства Grok претерпела значительную эволюцию:

версия моделиОсновные технологические парадигмыРаспределение вычислительных ресурсовОсновные прорывы
Грок 2Предсказание следующего жетонаОсновное внимание уделяется базовой предварительной подготовкеУвеличение масштаба
Грок 3Предварительное обучение + предварительная RL10-кратное увеличение арифметических навыков до обученияВведение навыков рассуждения
Грок 4Слияние родных инструментов + крупномасштабный RLАрифметика RL увеличилась еще в 10 разИспользование инструментов и мультиинтеллектуальность

Основная технологическая архитектура: инновационный дизайн для интеграции

Механизм обучения интеграции инструментов

Самым большим технологическим новшеством Grok 4 является интеграция возможностей использования инструментов непосредственно в процесс обучения, а не традиционный подход "после интеграции":

Технические характеристикиТрадиционные программыПрограмма Grok 4повышение производительности
Метод вызова инструментаИнтеграция Post APIИнтеграция родного обученияПовышение эффективности в 3-5 раз
кривая обученияПериод резкой адаптацииплавный ростЛучшая согласованность
масштабируемостьограниченный интерфейсомбесшовная интеграцияПоддержка сложных цепочек инструментов
последовательность рассужденийс лёгкими ошибкамиСплошная оптимизацияСнижение коэффициента ошибок 40%

Такая конструкция позволяет Grok 4 изучать, когда, как и зачем использовать конкретные инструменты во время обучения, а не просто вызывать внешние API.

Мультиразведывательная система взаимодействия

Grok 4 Heavy использует параллельный режим работы с несколькими интеллектами и имеет следующие технические характеристики:

Параметры совместной работытехническая спецификацияРабочие механизмы
Количество параллельных интеллектовДо 32Одновременное лечение одной и той же проблемы
Стратегии ветвления в рассужденияхдерево глубокого поискаКаждая ветвь исследуется независимо
Механизмы совместной проверкиАлгоритмы перекрестной валидацииМежведомственная проверка
выбор оптимального решенияИнтегрированное обучение FusionГенерация глобальных оптимальных ответов
Расчет расширений во время тестированияРегулируется от 1× до 32×Динамически подстраивается под сложность задачи

Эта "команда аспирантов, работающих в группах", увеличила точность 40% до более чем 50% для индивидуальных интеллектов.

Параметры работы модели

Основные показателиТехнические характеристики Grok 4Сравнение отраслей
Длина контекста256K токеновСтандарты корпоративных приложений
Номер версии APIgrok-4-0709Последняя стабильная версия
скорость мышления75 жетонов/секундуЗа Клодом 4 Опус (66 жетонов/секунду)
Оптимизация задержкиСокращение вдвоеГолосовое взаимодействие в режиме реального времени
одновременная обработкаПоддержка многопользовательского режима с высокой степенью параллелизмаГотовность к коммерциализации
эпоха моделированияИнфраструктура 7-го поколенияНовейший стек технологий xAI

Бенчмаркинг производительности: ведущий интеллект во всем мире

Академические навыки и навыки рассуждения

Grok 4 доказывает свой "постдокторский уровень" интеллекта, участвуя в самых престижных тестах:

Категория испытанийКонкретные контрольные показателиОценка Grok 4Grok 4 HeavyСравнение уровней докторской степени для людей
общая темаHLE (Human Legacy Examination)38.6%44.4%Больше, чем большинство аспирантов
математический конкурсAIME25100%100%уровень полной отметки
Команда по математикеHMMT2596.7%96.7%Высший уровень соревнований
Вопросы и ответы аспирантовGPQA88.9%88.9%Докторантура начального уровня
олимпиада по математикеUSAMO2561.9%61.9%Международный уровень соревнований
конкурс программистовLCB (январь-май)79.4%79.4%Уровень профессионального программиста

Оценка основных компетенций AGI

Grok 4 также преуспел в ключевом тесте General AI:

Предметы теста AGIПроизводительность Grok 4техническое значениеСравнение с конкурентами
ARC-AGI-215.9%Первая коммерческая модель, разбившая 10%В 12 раз выше, чем у DeepSeek R1
ARC-AGI-166.7%Способность обобщать известные закономерностиПревзошел GPT-4 почти на 6 процентных пунктов
коэффициент экономической эффективностиоптимальныйСамый умный в пересчете на долларЛучшее в отрасли соотношение цены и качества

Специальные сценарии испытаний

В ряде уникальных тестовых сценариев Grok 4 продемонстрировал способность превзойти традиционный ИИ:

тестовый сценарийконкретное выражениеТехнические последствия
Бизнес-тест с вендинговым стендомЧистая стоимость в два раза больше, чем у второго местаСпособность принимать долгосрочные бизнес-решения
RKG Drug DiscoveryЕдинственная модель, которая разбила 10%биомедицинские рассуждения
Сложное физическое моделированиеУспешное моделирование столкновений черных дырРазвитые навыки научных вычислений

Стратегия ценообразования и коммерциализации

У xAI есть четкая стратегия позиционирования Grok 4 на высоком уровне:

уровень обслуживанияЕжемесячное ценообразованиеЦены на годовую платуОсновные функциональные различия
SuperGrok$30$300Одноместный интеллектуальный кузов Стандартная версия
SuperGrok Heavy$300$3,000.Мультиинтеллектуальное издание для совместной работы

Такая ценовая стратегия позиционирует Grok 4 как высококлассный сервис искусственного интеллекта для корпоративных и профессиональных пользователей: годовая плата за Heavy-версию составляет до 21 500 китайских юаней.

Перспективы применения и интеграция в промышленность

Grok 4 будет быстро интегрирован в промышленную экосистему Маска: голосовой помощник был интегрирован в последнюю прошивку Tesla, а робот Optimus будет оснащен Grok как мозгом ИИ. xAI планирует выпустить специальные модели программирования, мультимодальные агенты и крупномасштабные модели генерации видео один за другим в течение следующих нескольких месяцев, чтобы создать полную матрицу продуктов ИИ.

Grok 4 занял лидирующие позиции в соревнованиях по искусственному интеллекту благодаря преимуществу в вычислительной мощности 200 000 кластеров GPU и технологическим инновациям в виде слияния нативных инструментов. Его ошеломляющая производительность в бенчмарках, особенно в сложных задачах, требующих глубоких рассуждений, знаменует собой значительный шаг на пути к "сверхчеловеческому интеллекту". Хотя высокая цена ограничивает его популярность, Grok 4 предлагает самый мощный вариант на рынке для профессиональных пользователей, стремящихся к максимальной мощности ИИ.

Если вы хотите использовать официальный платный эксклюзивный аккаунт GPT Plus, Claude Pro, Grok Super, вы можете связаться с нашей профессиональной командой (wx: f15303420735), если вы не знаете, как пополнить счет.

Для получения дополнительной продукции, пожалуйста, ознакомьтесь с

См. подробнее

ShirtAI - проникающий интеллект Большая модель AIGC: начало эры двойной революции в инженерном деле и науке - Проникающая разведка
1:1 Восстановление Клода и GPT Официальный сайт - AI Cloud Native Приложение для просмотра прямых трансляций матчей Global HD Sports Viewing Player (рекомендуется) - Blueshirt Technology
Транзитный сервис на основе официального API - GPTMeta API Помогите, может ли кто-нибудь из вас дать несколько советов о том, как задавать вопросы в GPT? - знание
Глобальный цифровой магазин виртуальных товаров - Global SmarTone (Feng Ling Ge) Насколько мощной является функция Claude airtfacts, что GPT мгновенно перестает хорошо пахнуть? -BeepBeep
Поиск

категории.

Информационный бюллетень

рекламное пространство

Станьте свидетелями супермагии искусственного интеллекта вместе!

Примите в свои объятия помощника с искусственным интеллектом и повысьте свою производительность одним щелчком мыши!