articleニュース
Microsoft、自社 AI モデル群「MAI」を公開――画像・音声・文字起こし分野で OpenAI 依存を削減へ
Microsoft が独自開発の AI モデルファミリー「MAI」シリーズ(MAI-Image 2.5・MAI-Voice 2・MAI-Transcribe 1.5)を公開した。画像生成・音声合成・音声文字起こしの各領域で OpenAI モデルを段階的に置き換え、自社製品への統合を進める戦略の一環。
概要
※本記事は公開情報をもとに編集部が再構成したサマリです。一次情報は出典欄をご参照ください。
Microsoft は 2026 年 5 月、自社開発 AI モデルのファミリーブランド「MAI(Microsoft AI)」を発表した。画像生成領域の「MAI-Image 2.5」、音声合成領域の「MAI-Voice 2」、音声文字起こし領域の「MAI-Transcribe 1.5」の 3 モデルで構成される。これらは Microsoft 365・Copilot・Azure AI サービスに順次統合される予定で、画像・音声系ワークロードにおける OpenAI モデル(DALL-E・Whisper・TTS)の置き換えを進める組織的な戦略転換を意味する。
事実のポイント
- MAI-Image 2.5: 画像生成モデル。Designer・Bing Image Creator に統合予定
- MAI-Voice 2: テキスト読み上げ(TTS)・音声合成モデル。Teams・Edge の音声機能に統合
- MAI-Transcribe 1.5: 音声文字起こしモデル。Teams 会議の文字起こし・リアルタイム翻訳に活用
- 3 モデルは Azure AI Foundry 経由で API 提供も予定
- Project Polaris(コーディング AI)と合わせ、Microsoft の主要 AI ワークロードを自社モデルで賄う長期計画が明確になった
用語・背景の補足
MAI(Microsoft AI): Microsoft が独自開発した AI モデル群のブランド名。Google が Gemini、Meta が Llama を自社製品に統合するのと同様に、Microsoft も OpenAI への依存度を下げながら AI コスト構造を最適化する動きを加速している。
注意点
- 各 MAI モデルの性能ベンチマークと OpenAI 対応モデルとの比較はまだ公開情報が限られている
- 既存の Azure OpenAI Service を使って構築したアプリケーションへの影響は今後明らかになる
- OpenAI との独占契約の範囲・更新条件次第で統合スケジュールが変わる可能性がある
編集部見解
(追記予定)
info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。