articleニュース
Gemini in Google Sheets、複雑スプレッドシートの自律操作で人間専門家の 70% 水準に到達
Google が Gemini in Google Sheets の更新を発表。SpreadsheetBench 全データセットでの自律操作成功率が 70.48% に達し、複雑な実務スプレッドシートでの人間専門家に迫る水準を公表した。
概要
※本記事は公開情報をもとに編集部が再構成したサマリです。一次情報は出典欄をご参照ください。
Google は Gemini in Google Sheets のアップデートを発表し、複雑な実務スプレッドシートを自律的に操作するベンチマーク「SpreadsheetBench」の全データセットにおいて 70.48% の成功率を記録したと公表した。2026 年 5 月 6 日より段階的に展開が開始されており、複雑な表計算の生成・編集を AI が補助する機能が本番利用に近い水準に達しつつある。
事実のポイント
- Gemini in Sheets が SpreadsheetBench 全データセットで 70.48% の自律操作成功率を達成したと Google が発表
- 「人間専門家水準に迫る」と表現されており、複雑な実務スプレッドシートへの対応精度が向上
- 段階的ロールアウトは 2026 年 5 月 6 日に開始
- 集計・条件付き書式・参照関数など複雑な操作を自然言語の指示から実行できる
- Google Workspace Business / Enterprise プランで利用可能(段階展開のため全ユーザーへの到達には数週間を要する見込み)
用語・背景の補足
SpreadsheetBench とは: 複雑な実務スプレッドシートを AI が自律的に操作できるかを評価するためのベンチマークデータセット。単純な数式入力ではなく、複数シートにまたがる参照・ピボット・条件分岐など、現場で実際に扱われるような難易度の高いタスク群で構成される。
70.48% の意味: ベンチマーク上の全タスクのうち 70.48% を AI が正しく完了できたことを示す。ただし、この数値はベンチマーク環境での結果であり、実務での性能は業務内容・データ構造によって異なる。
段階的ロールアウト: Google Workspace の更新は一斉展開ではなく、管理者アカウントのドメインに段階的に配信される方式を採る。「対象になっているはずなのに使えない」場合は展開待ちの可能性が高い。
注意点
- ベンチマーク上の 70.48% は「特定のデータセットでの結果」であり、自社のスプレッドシートに同等の精度が保証されるわけではない
- 機密情報を含む社内データをクラウド AI に渡す場合は、Workspace データ処理ポリシーおよび社内情報管理ルールの確認が必要
- まだ段階的ロールアウト中のため、Workspace 管理者の設定によっては利用できないテナントがある
編集部見解
(追記予定)
info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。