Anthropic は 4 月 25 日、AI エージェント同士が物品を売買する社内実証実験「Project Deal」の結果を公表しました。69 名の従業員が各 100 ドルのギフトカード予算で参加し、Claude ベースの個人エージェントが Slack 上で自律的に出品・交渉・取引を行う構成です。

主なポイント

  • 期間中に合計 186 件・4,000 ドル超の取引が成立し、出品から成約までを事前定義されたプロトコルなしの自然言語交渉だけで完結させた。
  • 4 種類の環境を比較し、Claude Opus 4.5 を使うエージェントは Claude Haiku 4.5 を使うエージェントよりも平均 2 件多く取引を成約した。
  • 同一の商品が両モデルで売却された場合、Opus エージェントの方が 1 件あたり平均 3.64 ドル高い価格で売却に成功した。
  • 初期プロンプトの違いは取引成立率や最終価格にほとんど影響せず、モデル能力差の方が成果を決める主要因だったと結論付けている。

出典: Anthropic created a test marketplace for agent-on-agent commerce (TechCrunch)