ファクトシート
| 発表日 | 2026-04-07 |
|---|---|
| 発表元 | Ahmad Al-Dahle 公式発信 |
| 種別 | キーパーソン発信 |
articleニュース
Meta の前 Generative AI VP Ahmad Al-Dahle が 2026 年 4 月 7 日、Llama 4 Maverick / Scout がテストセットで学習されたとの噂を否定。「Meta が決してそうしたことはしない」と公式に発信した。
| 発表日 | 2026-04-07 |
|---|---|
| 発表元 | Ahmad Al-Dahle 公式発信 |
| 種別 | キーパーソン発信 |
Meta の前 Generative AI VP Ahmad Al-Dahle 氏は 2026年4月7日、Llama 4 Maverick / Scout のベンチマーク結果が評価用テストセットで学習されたのではないかという疑惑を否定する発信を行った。「Meta はテストセットで学習することは決してしない」と明言し、疑惑への対応を図った。
Llama 4 はオープンウェイトでMoE(Mixture of Experts)アーキテクチャを採用したモデルで、公開時に主要ベンチマークで高スコアを記録した。しかしその後、ベンチマーク汚染(benchmark contamination)の可能性を指摘する声が上がり、AI コミュニティで議論を呼んだ。
ベンチマーク評価の信頼性はモデル選定の根拠として重要だ。「テストセット学習」疑惑はオープンウェイトモデルに限らず大手クローズドモデルでも過去に指摘されており、独立した評価機関・評価手法の整備が業界全体の課題となっている。
info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。
目的に合った入口からお気軽にどうぞ。すべてカジュアル相談OKです。