tag

#AI-for-Science

このタグが付いた記事

Index

count=1
  1. AI / MLtheme: テクノロジー

    OpenAI が GeneBench-Pro を公開 計算生物学の AI エージェント評価に 129 問

    OpenAI は 6月30日、AI エージェントが計算生物学の泥臭い実データを扱えるかを測る新ベンチマーク GeneBench-Pro を公開しました。フラッグシップの GPT-5.6 Sol でも Pro モード時の正解率は 31.5% にとどまり、ドメイン推論の壁が改めて示されました。