コンテンツ詳細

テクノロジーと知識が絡み合う世界では、読書はすべて、知恵を与え、無限の創造性を刺激する素晴らしい冒険のようなものだ。

Grok 4:20万個のGPUで構築されたマスクの「最も賢い」AIモデル

北京時間7月10日、世界が注目するのを待つこと1時間、マスクはついにxAIの最新傑作、マスクが「世界で最も賢いAI」と呼ぶGrok 4の謎を公開した。マスクが「世界一賢いAI」と称したこのモデルは、発表されるやいなや主要ベンチマークテストで新記録を樹立し、「Human Last Exam」(HLE)で50%の精度を突破した初のAIモデルとなった。

算術スケール:前例のないトレーニング入力

Grok 4のトレーニングの規模は、xAIのAIインフラへの莫大な投資を反映したもので、前例のないレベルのコンピューティングパワーを割り当てている:

インフラ構成

ハードウェア構成仕様用途の割り当て
プレトレーニングクラスター100,000 H100 GPU基本モデルのトレーニング
強化された学習クラスターH100/A100ミックス 200,000枚RLの微調整と推論の最適化
総計算能力(TCP)コロッサス・スーパーコンピューティング・センター全工程AIトレーニング
トレーニング期間比率グロック2より100倍良いディープラーニングの反復
RL計算比率Grok 3より10倍向上集中学習に特化

マスクは、xAIが事前学習とほぼ同程度の演算量を強化学習に投資していることを明らかにした。これは、業界では極めて珍しい「デュアルエンジン」主導のトレーニングアプローチである。チームはモデルを第一原理から考え、推論し、自己修正するように訓練し、これがGrokシリーズの推論能力の核心的な源となっている。

トレーニング・アーキテクチャの進化

グロック・ファミリーのトレーニング・パラダイムは大きな進化を遂げた:

モデルバージョン主な技術パラダイム計算リソースの割り当てコア・ブレイクスルー
Grok 2次のトークン予想基本的な事前トレーニングが中心規模拡大
グロック3事前トレーニング+予備RLトレーニング前の算数が10倍に推論スキルの導入
グロック4ネイティブ・ツール・フュージョン+大規模RLRLの演算がさらに10倍向上道具の使用とマルチインテリジェンス

コア・テクノロジー・アーキテクチャ:ネイティブな統合のための革新的な設計

ツール統合トレーニングの仕組み

Grok 4の最大の技術革新は、従来の統合後のアプローチではなく、ツール使用機能をトレーニングプロセスに直接統合したことである:

技術的特徴伝統的なプログラムグロック4プログラムパフォーマンス向上
ツール呼び出しメソッドポストAPI統合ネイティブ・トレーニングの統合効率を3~5倍高める
ラーニングカーブ急な適応の時期順調な成長より良い一貫性
スケーラビリティインターフェースによる制約シームレスな統合複雑なツールチェーンのサポート
推論の一貫性故障しやすいエンド・ツー・エンドの最適化エラー率低減 40%

この設計により、Grok 4はトレーニング中に、単に外部APIを呼び出すのではなく、特定のツールをいつ、どのように、そしてなぜ使うのかを学ぶことができる。

マルチインテリジェンス・コラボレーション・システム

Grok 4 Heavyは、以下の技術仕様のマルチインテリジェンス並列動作モードを採用している:

コラボレーション・パラメーター技術仕様作業メカニズム
並列知能の数最大32同じ問題の同時治療
推論の分岐戦略ディープサーチツリー各ブランチは独立して探索される
共同検証メカニズム交差検証アルゴリズム諜報機関間のチェック
最適解の選択統合学習フュージョングローバル最適解生成
テスト中のエクステンションの計算1倍から32倍まで調整可能タスクの複雑さに応じて動的に調整

この "博士課程の学生によるグループ作業チーム "は、個人の知能について40%の精度を50%以上にまで高めた。

モデル性能パラメーター

コア指標Grok 4の仕様業界比較
コンテキストの長さ256Kトークンエンタープライズ・アプリケーション標準
APIバージョン番号Grok-4-0709最新安定版
推理速度75トークン/秒ビヨンド・クロード4 Opus(66トークン/秒)
待ち時間の最適化エンド・ツー・エンドのハーフ化リアルタイムでの音声対話
並行処理マルチユーザーによる高い同時実行性をサポート商業化の準備
モデル時代第7世代インフラxAIの最新技術スタック

パフォーマンスのベンチマーク:インテリジェンスを全面的にリードする

学力と推理力

グロック4は、最も権威あるテストで好成績を収めることで、その「ポスドク・レベル」の知性を証明している:

テストカテゴリー具体的なベンチマークグロック4スコアグロック4ヘビー人間の博士号レベルの比較
総合科目HLE(ヒューマン・レガシー・エグザミネーション)38.6%44.4%ほとんどの博士課程の学生を超える
数学コンテストAIME25100%100%満点レベル
チーム数学HMMT2596.7%96.7%トップコンペティションレベル
大学院生Q&Aジーピーキューエー88.9%88.9%博士入学レベル
数学オリンピックUSAMO2561.9%61.9%国際大会レベル
プログラミング・コンペティションLCB(1月~5月)79.4%79.4%プロフェッショナル・プログラマー・レベル

AGIコア・コンピテンシー評価

グロック4は、一般的なAIという重要なテストでも優れていた:

AGIテスト項目グロック4のパフォーマンス技術的意義競合他社との比較
ARC-AGI-215.9%市販モデル初の10%突破ディープシークR1の12倍
ARC-AGI-166.7%既知のパターンを一般化する能力GPT-4を6ポイント近く上回る
費用対効果比最適最も賢い単価業界をリードする価格性能比

特別なテストシナリオ

多くのユニークなテストシナリオにおいて、Grok 4は従来のAIを凌駕する能力を実証した:

テストシナリオ具体的表現技術的な意味合い
自販機ビジネステスト純資産は2位の2倍長期的な経営意思決定能力
RKG創薬10%を破った唯一のモデル生物医学的推論
複雑な物理モデリングブラックホール衝突のシミュレーションに成功高度な科学計算スキル

価格設定と商品化戦略

xAIはGrok 4のハイエンドポジショニング戦略を明確にしている:

サービスレベル月額料金年会費価格コア機能の違い
スーパーグロック$30$300シングル・インテリジェント・ボディ スタンダード・エディション
スーパーグロック・ヘビー$300$3,000マルチ・インテリジェンス・コラボレーション・エディション

この価格戦略により、Grok 4は企業やプロフェッショナルユーザー向けのハイエンドAIサービスと位置づけられ、ヘビーバージョンの年間利用料は最大2万1500人民元となる。

アプリケーションの展望と産業統合

この音声アシスタントはテスラの最新ファームウェアに統合され、オプティマスロボットにはAI頭脳としてGrokが搭載される予定だ。xAIは今後数ヶ月のうちに、専用のプログラミングモデル、マルチモーダルエージェント、大規模ビデオ生成モデルを次々とリリースし、完全なAI製品マトリックスを構築する計画だ。

Grok4は、20万GPUクラスタの演算能力とネイティブ・ツール・フュージョンの技術革新により、AI競争で主導的地位を確立した。ベンチマーク、特に深い推論を必要とする複雑なタスクにおけるその圧倒的な性能は、「超人間的知性」への重要な一歩を示している。高価格であるため普及には限界があるが、Grok 4は、究極のAIパワーを求めるプロフェッショナル・ユーザーにとって、今日の市場で最も強力な選択肢を提供する。

GPT Plus、Claude Pro、Grok Superの公式有料専用アカウントを使用したい場合、トップアップの方法がわからない場合は、当社の専門チーム(wx: f15303420735)にお問い合わせください。

その他の製品については

詳細はこちら

シャツAI - 貫通する知性 AIGCビッグ・モデル:工学と科学の二大革命の時代を切り開く - Penetrating Intelligence
クロードとGPTの1:1復元 公式サイト - AI Cloud Native ライブマッチアプリ グローバルHDスポーツ観戦プレーヤー(推奨) - Blueshirt Technology
公式APIに基づくトランジットサービス - GPTMeta API GPTで質問するときのコツを教えてください。- 知識
グローバルバーチャルグッズデジタルストア - グローバルスマートーン(馮玲葛) GPTが瞬時にいい匂いを感じなくなるクロード・エアトファクト機能の実力は?-ピーピーピー
検索

のカテゴリーに分類される。

ニュースレター

広告スペース

AIのスーパーマジックを一緒に目撃しよう!

AIアシスタントを活用し、ワンクリックで生産性を向上させましょう!