Anthropic は 4 月 6 日、これまで同社が構築した中で最も高性能なフロンティアモデル「Claude Mythos」と、重要インフラ防御を目的としたイニシアチブ「Project Glasswing」を発表しました。Mythos は CyberGym ベンチマークで 83.1% を記録し、主要 OS やブラウザを含む多数の高深刻度脆弱性を既に発見しています。

主なポイント

  • Claude Mythos は脆弱性発見から攻撃コードの生成まで自律的に行える水準のコーディング能力を備えるため、一般公開は見送られる
  • 悪用時のリスクを踏まえ、Project Glasswing として約 50 組織に gated access を限定提供
  • 初期パートナーに AWS / Apple / Cisco / CrowdStrike / Google / JPMorganChase / Linux Foundation / Microsoft / NVIDIA / Palo Alto Networks が参加
  • Anthropic は研究プレビュー期間中に 1 億ドル相当のモデル利用クレジットを拠出
  • 民間インフラの脆弱性事前発見・修正を、攻撃側より先に AI で進める構想

出典: Project Glasswing: Securing critical software for the AI era