articleニュース
Google DeepMind、Gemini Robotics-ER 1.6を公開——計器読取り精度23%→93%に向上
Google DeepMindが具身知能(Embodied Reasoning)モデル「Gemini Robotics-ER 1.6」を開発者向けに公開。アナログ計器・圧力計・サイトグラスの読取り精度を23%から93%に向上させ、産業点検・設備保全分野での実用化を加速する。
概要
Google DeepMindは2026年4月14日〜15日、具身知能(Embodied Reasoning)に特化したAIモデル「Gemini Robotics-ER 1.6」を、Gemini APIおよびGoogle AI Studio経由で開発者向けに一般公開した。Boston Dynamicsとの協業から派生した研究成果を応用し、ロボットが現実環境のアナログ計器・圧力計・サイトグラス(液面確認窓)などを視覚的に読み取る精度を大幅に改善。産業設備点検・プラント監視・設備保全DXへの応用が期待される。
事実のポイント
- アナログ計器・圧力計・サイトグラス読取り精度: 23% → 93% に向上(約4倍の改善)
- Multi-view(多視点)成功検出率: 84%を達成(複数カメラアングルからの統合認識)
- Pointing・Counting(指示・個数数え)精度: 61% → 80% に改善
- Gemini API・Google AI Studio から開発者が利用可能(APIキーさえあればアクセス可能)
- Boston Dynamicsとの協業から派生した設備点検ユースケースに対応した訓練データを含む
- 前バージョン(Gemini Robotics-ER 1.5)からの継続的改善であり、産業実装を強く意識したロードマップ
用語・背景の補足
具身知能(Embodied Reasoning): AIが物理的な環境を視覚・センサーで知覚し、空間認識・物体操作・移動などを理解・制御する能力。「言語処理だけのAI」に対して「身体を持つかのように世界を理解するAI」を指す。産業ロボット・自律走行・設備点検ロボットへの応用が進んでいる。
サイトグラス(Sight Glass): 配管や機器の液面・流量を目視確認するためのガラス窓。石油化学・食品・製薬プラントなどで広く使われており、定期点検での読み取りが人員コストとして課題となっている。AIによる自動読取りは点検業務の無人化・24時間監視を可能にする。
Gemini Robotics: Googleが推進する産業・ロボット向けのAIモデル群。一般向けの会話AI(Gemini)とは別に、ロボット制御・空間認識・産業点検に特化した派生モデルを提供。Boston DynamicsはGoogle(Alphabet)傘下の企業。
注意点
- Gemini Robotics-ER 1.6はモデルのみの提供であり、ロボットハードウェアは別途調達が必要
- 「23%→93%」という数値はモデル単体のベンチマーク結果であり、実際の現場環境での性能は機材・照明・汚染度等の条件で変わる
- 一般公開はAPI経由のみであり、大規模商用展開には個別契約が必要な場合がある
編集部見解
info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。