articleニュース

Gemini in Google Sheets、複雑スプレッドシートの自律操作で人間専門家の 70% 水準に到達

in Google Sheets の更新を発表。SpreadsheetBench 全データセットでの自律操作成功率が 70.48% に達し、複雑な実務スプレッドシートでの人間専門家に迫る水準を公表した。

概要

※本記事は公開情報をもとに編集部が再構成したサマリです。一次情報は出典欄をご参照ください。

in Google Sheets のアップデートを発表し、複雑な実務スプレッドシートを自律的に操作する「SpreadsheetBench」の全データセットにおいて 70.48% の成功率を記録したと公表した。2026 年 5 月 6 日より段階的に展開が開始されており、複雑な表計算の生成・編集を AI が補助する機能が本番利用に近い水準に達しつつある。

事実のポイント

  • Gemini in Sheets が SpreadsheetBench 全データセットで 70.48% の自律操作成功率を達成したと Google が発表
  • 「人間専門家水準に迫る」と表現されており、複雑な実務スプレッドシートへの対応精度が向上
  • 段階的ロールアウトは 2026 年 5 月 6 日に開始
  • 集計・条件付き書式・参照関数など複雑な操作を自然言語の指示から実行できる
  • Business / Enterprise プランで利用可能(段階展開のため全ユーザーへの到達には数週間を要する見込み)

用語・背景の補足

SpreadsheetBench とは: 複雑な実務スプレッドシートを AI が自律的に操作できるかを評価するためのベンチマークデータセット。単純な数式入力ではなく、複数シートにまたがる参照・ピボット・条件分岐など、現場で実際に扱われるような難易度の高いタスク群で構成される。

70.48% の意味: ベンチマーク上の全タスクのうち 70.48% を AI が正しく完了できたことを示す。ただし、この数値はベンチマーク環境での結果であり、実務での性能は業務内容・データ構造によって異なる。

段階的ロールアウト: Google Workspace の更新は一斉展開ではなく、管理者アカウントのドメインに段階的に配信される方式を採る。「対象になっているはずなのに使えない」場合は展開待ちの可能性が高い。

注意点

  • ベンチマーク上の 70.48% は「特定のデータセットでの結果」であり、自社のスプレッドシートに同等の精度が保証されるわけではない
  • 機密情報を含む社内データを AI に渡す場合は、Workspace データ処理ポリシーおよび社内情報管理ルールの確認が必要
  • まだ段階的ロールアウト中のため、Workspace 管理者の設定によっては利用できないテナントがある

編集部見解

(追記予定)

info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。

出典

arrow_backニュース・トピックス一覧へ Autais

5つのご相談入口

目的に合った入口からお気軽にどうぞ。すべてカジュアル相談OKです。