articleニュース

Ahmad Al-Dahle(前 Meta GenAI VP)、Llama 4 のベンチマーク不正疑惑を否定

の前 Generative AI VP Ahmad Al-Dahle が 2026 年 4 月 7 日、 4 Maverick / Scout がテストセットで学習されたとの噂を否定。「Meta が決してそうしたことはしない」と公式に発信した。

format_list_bulleted発表内容

  • 4 Maverick / Scout の結果に対する不正疑惑が浮上
  • Al-Dahle 氏は「 はテストセットで学習することは決してしない」と否定
  • 4 はオープンウェイト・MoE アーキテクチャを採用

ファクトシート

発表日 2026-04-07
発表元 Ahmad Al-Dahle 公式発信
種別 キーパーソン発信

概要

の前 Generative AI VP Ahmad Al-Dahle 氏は 2026年4月7日、 4 Maverick / Scout の結果が評価用テストセットで学習されたのではないかという疑惑を否定する発信を行った。「Meta はテストセットで学習することは決してしない」と明言し、疑惑への対応を図った。

Llama 4 はオープンウェイトでMoE(Mixture of Experts)アーキテクチャを採用したで、公開時に主要ベンチマークで高スコアを記録した。しかしその後、ベンチマーク汚染(benchmark contamination)の可能性を指摘する声が上がり、AI コミュニティで議論を呼んだ。

ベンチマーク評価の信頼性はモデル選定の根拠として重要だ。「テストセット学習」疑惑はオープンウェイトモデルに限らず大手クローズドモデルでも過去に指摘されており、独立した評価機関・評価手法の整備が業界全体の課題となっている。

ポイント

  • Llama 4 Maverick / Scout のベンチマーク結果に対する不正疑惑が浮上
  • Al-Dahle 氏は「Meta はテストセットで学習することは決してしない」と否定
  • Llama 4 はオープンウェイト・MoE アーキテクチャを採用

info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。

出典

arrow_backニュース・トピックス一覧へ Autais

5つのご相談入口

目的に合った入口からお気軽にどうぞ。すべてカジュアル相談OKです。