Google は 4 月 22 日、Google Cloud Next 2026 で第 8 世代 TPU「TPU 8t」「TPU 8i」を発表しました。学習と推論でアクセラレータを分ける方針に転換し、ホスト CPU を自社 ARM サーバー「Axion」に統一して、フロンティアモデルの開発サイクルを「数カ月から数週間に短縮する」と位置付けています。

主なポイント

  • TPU 8t は大規模事前学習向け。前世代 Ironwood (TPU 7) 比で同価格帯でスループット 2.8 倍を謳う
  • TPU 8i は推論専用設計。同価格帯で 80% の性能向上、電力効率も前世代比 2 倍
  • 両 SKU とも Google が自社開発する ARM CPU「Axion」をホストに配置し、学習・推論の両パイプラインを共通プラットフォーム上で運用可能にする
  • Anthropic は同チップへの初期アクセスを得て、次世代 Claude の学習で TPU 8t を利用予定と発表
  • 提供は 2026 年後半から開始。Google Cloud の AI Hypercomputer スタックの一部として、NVIDIA Rubin ベース VM と併存する形を取る

出典: Our eighth generation TPUs: two chips for the agentic era