中国の AI ラボ DeepSeek は 4 月 24 日、新世代フラグシップ「DeepSeek V4」のプレビュー版として V4-Pro と V4-Flash の 2 モデルを公開しました。いずれも MoE (Mixture-of-Experts) を採用し、MIT ライセンスで Hugging Face に重みが置かれています。

主なポイント

  • V4-Pro は総パラメータ 1.6 兆 / アクティブ 49B、V4-Flash は総 284B / アクティブ 13B。両モデルとも 1M トークンの文脈窓を持つ
  • 新アーキテクチャ「Hybrid Attention」により長文脈でのメモリ参照を改善。V3.2 比で推論 FLOPs を約 27%、KV キャッシュを約 10% に削減
  • SWE-bench Verified で 80.6% を記録し、Claude Opus 4.6 と 0.2 ポイント差。Terminal-Bench 2.0 や LiveCodeBench では上回る結果
  • API 価格は V4-Pro が出力 100 万トークン 3.48 ドル、V4-Flash は 0.28 ドル。GPT-5.5 や Claude に対し桁違いの低コストを打ち出した
  • フロンティアモデルには知識面で 3〜6 か月遅れるものの、コーディング / エージェント用途では肉薄する水準

出典: DeepSeek previews new AI model that 'closes the gap' with frontier models