Google Cloud
Google LLC (Google Cloud & AI Infrastructure)
主要製品
TPU v5e AIアクセラレータ、A3 GPUクラスター(H100ベース)
詳細情報▼ 展開
Google LLCが運営するGoogle Cloud Platform(GCP)は売上高でAWS・Azureに次ぐ世界第3位のクラウドだ。GoogleはAIコンピュートのハイパースケーラー買い手であると同時に、第6世代まで進化したTensor Processing Unit(TPU)プログラムを通じて自ら半導体設計者でもあるという独自の立場を占める。 GoogleのTPUプログラムは2013年に社内プロジェクトとして始まった。ニューラルネットワーク推論の加速が目的で、深層学習の主要演算である行列乗算にCPU・GPUが非効率であるという認識から生まれた。第1世代TPUは2015年に社内展開され、2017年に公表。第2世代から第5世代(TPU v5e/v5p)へと推論専用からデータセンタースケールの学習+推論まで進化している。 TPUのサプライチェーン:①Googleのハードウェアチームがチップアーキテクチャ・マイクロアーキテクチャを定義;②BroadcomがASIC設計パートナーとして物理設計とテープアウト専門性を提供;③TSMCが先端ノードでチップを製造(TPU v4はN7、TPU v5eはN4);④Quanta ComputerなどのODMがカスタムのラックスケールシステムに組み立てる。このエンドツーエンドのカスタムスタックにより、市販のNVIDIAハードウェアでは実現できない方法でトランスフォーマーワークロードに最適化されたシステム効率を達成できる。 TPUが最適でないワークロード——特にNVIDIAで学習したモデルを持ち込むサードパーティのAIモデル提供——にはGoogle CloudはNVIDIA A100・H100・H200ベースのA2・A3・A3 Megaインスタンスを提供する。つまりGoogleはTPU開発者であると同時に重要なNVIDIA GPU顧客でもある。 GoogleとBroadcomの緊密な統合(ネットワーキングASIC・スイッチシリコン・TPU共同設計)により、Google-Broadcom-TSMCの三角形はAIインフラにおける最も戦略的に重要なサプライチェーン関係の一つとなっている。
クリティカルパス — 原料シリコンから配備まで
ファウンドリ
TSMC ▲
CoWoS先進パッケージング、N3/N2ロジック
チップ設計
Broadcom
TPU ASIC(Google向け)、ネットワーキングASIC
電力・冷却
Vertiv ▲
液冷・UPS・PDUシステム
クラウドプロバイダー
Google Cloud
TPU v5e AIアクセラレータ、A3 GPUクラスター(H100ベース)
AI消費者
Anthropic
Claude 3.5 Sonnet、Claude 3 Opus(フロンティアAIモデル)