Anthropic は 4 月 6 日、これまで同社が構築した中で最も高性能なフロンティアモデル「Claude Mythos」と、重要インフラ防御を目的としたイニシアチブ「Project Glasswing」を発表しました。Mythos は CyberGym ベンチマークで 83.1% を記録し、主要 OS やブラウザを含む多数の高深刻度脆弱性を既に発見しています。
主なポイント
- Claude Mythos は脆弱性発見から攻撃コードの生成まで自律的に行える水準のコーディング能力を備えるため、一般公開は見送られる
- 悪用時のリスクを踏まえ、Project Glasswing として約 50 組織に gated access を限定提供
- 初期パートナーに AWS / Apple / Cisco / CrowdStrike / Google / JPMorganChase / Linux Foundation / Microsoft / NVIDIA / Palo Alto Networks が参加
- Anthropic は研究プレビュー期間中に 1 億ドル相当のモデル利用クレジットを拠出
- 民間インフラの脆弱性事前発見・修正を、攻撃側より先に AI で進める構想
出典: Project Glasswing: Securing critical software for the AI era