OpenAI、GPT-5.5 向け Bio Bug Bounty を開始 ⇒ ユニバーサル jailbreak 成功で 2.5 万ドル

OpenAI は GPT-5.5 を対象とした限定型のバイオセーフティ専用バグバウンティ「Bio Bug Bounty」を 4 月 23 日に開始しました。GPT-5.5 のシステムカード評価を補完し、生物学領域の二重利用リスクへの安全策を強化することを目的としています。

主なポイント

課題は、Codex Desktop 上のクリーンチャットからモデレーションを発動させずに 5 つのバイオセーフティ質問すべてに正しく回答させる「ユニバーサル jailbreak プロンプト」を 1 本で発見すること
最初に完全な jailbreak を実証した研究者に最高 2.5 万ドル。部分的な成功には裁量で報酬が支払われる
応募は招待制 / 申請制で、身元審査を通過した参加者に NDA 下で参加権が付与される。応募期間は 4 月 23 日から 6 月 22 日、テスト期間は 4 月 28 日から 7 月 27 日まで
プロンプト・出力・所見・コミュニケーションのすべてが NDA 対象。jailbreak の手口が不用意に拡散しないよう設計
バイオ領域に絞った賞金プログラムは異例で、GPT-5.5 のフロンティアモデルとしてのリスク統制を高める意図がうかがえる