#AI-for-Science
このタグが付いた記事
Index
count=1- AI / MLtheme: テクノロジー
OpenAI が GeneBench-Pro を公開 計算生物学の AI エージェント評価に 129 問
OpenAI は 6月30日、AI エージェントが計算生物学の泥臭い実データを扱えるかを測る新ベンチマーク GeneBench-Pro を公開しました。フラッグシップの GPT-5.6 Sol でも Pro モード時の正解率は 31.5% にとどまり、ドメイン推論の壁が改めて示されました。