ファクトシート
| 公開日 | 2026-04-02 |
|---|---|
| 改訂日 | 2026-04-11 |
| 著者 | Dat Tran, Douwe Kiela |
| 発表先 | arXiv (cs.CL) |
| 論文ID | arXiv:2604.02460 |
| 分野 | LLMエージェント / マルチホップ推論 |
| 主要結果 | 等トークン予算下でSASがMASを一貫して上回るまたは同等 |
articleニュース
Dat Tran 氏と Douwe Kiela 氏が 2026 年 4 月 2 日に arXiv へ投稿。マルチエージェント LLM システム(MAS)の優位性は計算量増加で説明できると主張し、同じ思考トークン予算下では単一エージェント(SAS)が同等以上の性能を示すことを 3 モデルで実証。
| 公開日 | 2026-04-02 |
|---|---|
| 改訂日 | 2026-04-11 |
| 著者 | Dat Tran, Douwe Kiela |
| 発表先 | arXiv (cs.CL) |
| 論文ID | arXiv:2604.02460 |
| 分野 | LLMエージェント / マルチホップ推論 |
| 主要結果 | 等トークン予算下でSASがMASを一貫して上回るまたは同等 |
Dat Tran・Douwe Kiela 両氏が 2026年4月2日に arXiv へ投稿した本論文は、マルチエージェント LLM システム(MAS)が単一エージェント(SAS)より高性能に見える理由を情報理論的に分析し、その優位性が単なる「計算量の増加」で説明できると主張する位置論文だ。
AI エージェント分野ではマルチエージェントが流行しているが、複数のモデルが協調することで推論時の総トークン数が増える。本研究は「同じトークン予算で比べれば単一エージェントの方が効率的」という反直感的な結論を、Qwen3 / DeepSeek-R1-Distill-Llama / Gemini 2.5 の3ファミリーで実証した。
実務的な含意は大きく、エージェントシステムの性能をベンチマーク比較する際に「使用トークン数を揃えなければ比較が無意味」という提言はシステム設計・評価方法論の見直しを促す。マルチエージェントが有利な局面が存在することは否定していないが、コスト対効果の再検討を促す論文として注目されている。
info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。
目的に合った入口からお気軽にどうぞ。すべてカジュアル相談OKです。