articleニュース
Google、Gemini Embedding 2 を正式公開 — テキスト・画像・動画・音声を横断するマルチモーダル埋め込み API
Google が Gemini Embedding 2 を Gemini API と Vertex AI で正式公開した。テキスト・画像・動画・音声の横断検索や意味的マッチングを本番環境で利用可能にする安定版マルチモーダル埋め込みモデル。
概要
※本記事は公開情報をもとに編集部が再構成したサマリです。一次情報は出典欄をご参照ください。
Google は Gemini Embedding 2 を Gemini API および Vertex AI 経由で一般提供(GA)開始した。テキスト・画像・動画・音声の 4 種のモダリティを統合した埋め込みベクトルを生成できる安定版モデルであり、検索・推薦・分類・意味的マッチングなど、本番環境での利用を前提とした最適化が施されている。
事実のポイント
- Gemini Embedding 2 が Gemini API と Vertex AI で正式公開(GA)された
- テキスト・画像・動画・音声を横断したマルチモーダル埋め込みが単一 API から利用可能
- 安定版(stable)リリースのため、本番環境での利用・プロジェクト移行が可能な品質保証が付与された
- 意味的検索・コンテンツ推薦・ドキュメント分類などの RAG(検索拡張生成)構成に直接組み込める
- 既存の Gemini Embedding 1(旧版)からのマイグレーションパスが公式ドキュメントで提供されている
用語・背景の補足
埋め込み(Embedding)とは: テキストや画像などの非構造化データを、意味的な距離を保った数値ベクトルに変換する技術。「猫」と「ネコ」が近い位置に、「犬」は少し離れた位置に配置されるよう学習されており、意味検索・推薦・分類の基盤となる。
マルチモーダル埋め込みの意義: テキストと画像を同じベクトル空間に配置することで「この画像に近い文書を探す」「この説明文に合う動画を探す」といったクロスモーダル検索が実現できる。従来は各モダリティごとに別モデルが必要だった処理を単一 API に集約できる点が実用上の利点。
GA(General Availability)とは: ベータ段階を経て本番利用に適した安定版として正式提供されること。SLA(サービス品質保証)が適用されるため、企業システムへの組み込みに必要な保証水準に達する。
注意点
- 具体的な料金体系・クォータ上限は Vertex AI / Gemini API の公式ドキュメントで確認が必要
- モデルのバージョン固定(pin)を行わない場合、将来の自動更新で埋め込みベクトルの分布が変わる可能性がある
- マルチモーダル埋め込みの品質はタスクや業種によって異なるため、本番移行前のベンチマーク評価が推奨される
編集部見解
(追記予定)
info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。