articleニュース

論文「Single-Agent LLMs Outperform Multi-Agent Systems on Multi-Hop Reasoning」 — 等思考トークン予算下では単一エージェントが優位

Dat Tran 氏と Douwe Kiela 氏が 2026 年 4 月 2 日に へ投稿。 システム(MAS)の優位性は計算量増加で説明できると主張し、同じ思考予算下では単一(SAS)が同等以上の性能を示すことを 3 で実証。

format_list_bulleted発表内容

  • システム(MAS)の報告された性能向上は、増加した時計算量で説明できる」と主張する位置論文
  • 情報理論に基づく分析で、シングルシステム(SAS)の方が情報効率的になると予測
  • Qwen3 / -R1-Distill- / 2.5 の 3 ファミリーで実証実験
  • マルチホップタスクにおいて、SAS が MAS と同等または上回る結果を一貫して観察
  • 評価時には「使用した数を統一すべき」と提言

ファクトシート

公開日 2026-04-02
改訂日 2026-04-11
著者 Dat Tran, Douwe Kiela
発表先 (cs.CL)
論文ID :2604.02460
分野 / マルチホップ
主要結果 予算下でSASがMASを一貫して上回るまたは同等

概要

Dat Tran・Douwe Kiela 両氏が 2026年4月2日に へ投稿した本論文は、 システム(MAS)が単一(SAS)より高性能に見える理由を情報理論的に分析し、その優位性が単なる「計算量の増加」で説明できると主張する位置論文だ。

AI エージェント分野ではマルチエージェントが流行しているが、複数のが協調することで時の総数が増える。本研究は「同じトークン予算で比べれば単一エージェントの方が効率的」という反直感的な結論を、Qwen3 / -R1-Distill- / 2.5 の3ファミリーで実証した。

実務的な含意は大きく、エージェントシステムの性能を比較する際に「使用トークン数を揃えなければ比較が無意味」という提言はシステム設計・評価方法論の見直しを促す。マルチエージェントが有利な局面が存在することは否定していないが、コスト対効果の再検討を促す論文として注目されている。

ポイント

  • 「マルチエージェント LLM システムの性能向上は、増加した推論時計算量で説明できる」と主張する位置論文
  • 情報理論に基づく分析で、シングルエージェントの方が情報効率的と予測
  • Qwen3 / DeepSeek-R1-Distill-Llama / Gemini 2.5 の3モデルファミリーで実証
  • マルチホップ推論タスクで SAS が MAS と同等または上回る結果を一貫して観察
  • ベンチマーク評価時には「使用したトークン数を統一すべき」と提言

info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。

出典

arrow_backニュース・トピックス一覧へ Autais

5つのご相談入口

目的に合った入口からお気軽にどうぞ。すべてカジュアル相談OKです。