articleニュース
Google DeepMindがGenie 3を発表——720p・毎秒24フレームの3Dインタラクティブ世界モデルを生成
Google DeepMindが「Genie 3」を発表。前世代(10〜20秒のシミュレーション)から大幅に進化し、720p解像度・毎秒24フレームで数分間のインタラクティブな3D環境を生成できる「基盤世界モデル」。ゲーム・シミュレーション・ロボット研究への応用が期待されている。
概要
※本記事は公開情報をもとに編集部が再構成したサマリです。一次情報は出典欄をご参照ください。
Google DeepMindは、3Dインタラクティブ環境を生成できる「基盤世界モデル(Foundation World Model)」の新バージョン「Genie 3」を発表した。前世代のGenie 2が10〜20秒のシミュレーションにとどまっていたのに対し、Genie 3は720p解像度・毎秒24フレームで数分間の3Dインタラクティブ世界を生成できるとされる。ゲーム開発・シミュレーション・AI強化学習のための仮想環境生成への応用が期待されている。
事実のポイント
- 解像度・フレームレート: 720p・毎秒24フレーム(Genie 2の10〜20秒から数分間に大幅拡張)
- インタラクティブ: ユーザーの操作に応じてリアルタイムに3D環境が変化する双方向性を持つ
- 基盤世界モデル: 特定ゲーム・環境に特化したモデルではなく、汎用的な3D世界を生成できる「基盤モデル」として設計されているとされる
- 前世代との比較: Genie 2は10〜20秒程度の短いシミュレーション。Genie 3は数分間の持続的な3D環境生成に対応
- 想定応用領域: ゲームレベルデザイン・AIエージェントの強化学習用仮想環境・ロボット動作シミュレーション・映像・建築等の可視化
用語・背景の補足
基盤世界モデル(Foundation World Model): LLM(大規模言語モデル)の概念を3D世界の生成・シミュレーションに拡張したモデル。物理法則・空間認識・因果関係を学習し、「何かが起きたら次に何が起きるか」を予測・生成できる。
インタラクティブ3D環境: ユーザーやAIエージェントがアクションを入力し、それに応じて状態が変化するリアルタイムの仮想空間。ゲームエンジンで作られた環境と異なり、AIが動的に生成・変化させる。
強化学習のための仮想環境: AIが試行錯誤を繰り返して行動を学習する強化学習において、リアルな物理環境(ロボット・自動車等)の代わりにシミュレーション環境でトレーニングを行う用途。
注意点
- Genie 3は2026年5月時点で発表・研究段階であり、商業利用の可否・API提供時期は未定
- 「数分間の3D環境生成」は研究発表レベルの主張であり、商業製品としての品質・安定性は別途評価が必要
- ゲームや映像制作への商業応用には著作権・知的財産・コンテンツポリシー等の考慮が別途必要
編集部見解
(追記予定)
info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。