Anthropic、2026年選挙に向けた Claude のセーフガード更新を公表

Anthropic は 2026年4月27日、米国中間選挙とブラジル等の主要選挙を見据えた Claude のセーフガードを公表。Opus 4.7 は選挙関連 600 プロンプトテストで 100% 適切に応答、Sonnet 4.6 は 99.8% を記録。

format_list_bulleted発表内容

選挙関連 600 プロンプトベンチマークで Opus 4.7 が 100%、Sonnet 4.6 が 99.8% 適切に応答
政治的中立性テストでは Opus 4.7 が 95%、Sonnet 4.6 が 96%
「初めて、モデルが多段の影響力工作を人間の指示なしに end-to-end で計画・実行できるかを評価した」（直訳）
Claude は投票情報を求めるユーザーに TurboVote（Democracy Works 提供）への誘導バナーを表示
選挙セーフガードはブラジル選挙にも展開予定

ファクトシート

発表日	2026-04-27
発表元	Anthropic（公式ブログ）
種別	安全策アップデート
対象	Claude（Opus 4.7 / Sonnet 4.6）
主題	選挙偽情報・影響力工作対策

概要

Anthropicは2026年4月27日、2026年の米国中間選挙やブラジルなどの主要選挙を見据えたClaudeのセーフガード更新を公表した。選挙関連600プロンプトのベンチマークテストでは、Opus 4.7が100%、Sonnet 4.6が99.8%の適切応答率を記録しており、選挙偽情報や影響力工作への対策が高水準に達していることが示された。

特筆すべきは、今回初めて「モデルが多段の影響力工作を人間の指示なしにend-to-endで計画・実行できるか」を評価したという点だ。AIが自律的に選挙干渉活動を組み立てる能力の評価は、今後のAI安全性評価の重要な基準となる可能性がある。

実用的な施策として、Claudeは投票情報を求めるユーザーに対してTurboVote（Democracy Works提供）への誘導バナーを表示する機能も実装されている。選挙セーフガードはブラジル選挙にも展開予定で、民主主義プロセスの健全性を守るAI安全策として国際的な広がりを見せている。

ポイント

選挙関連600プロンプトベンチマークでOpus 4.7が100%、Sonnet 4.6が99.8%適切に応答
政治的中立性テストではOpus 4.7が95%、Sonnet 4.6が96%
「初めて、モデルが多段の影響力工作を人間の指示なしにend-to-endで計画・実行できるかを評価した」
Claudeは投票情報を求めるユーザーにTurboVote（Democracy Works提供）への誘導バナーを表示
選挙セーフガードはブラジル選挙にも展開予定

info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。

Anthropic、2026年選挙に向けた Claude のセーフガード更新を公表

format_list_bulleted発表内容

ファクトシート

概要

ポイント

関連リンク（公式）

出典

5つのご相談入口

無料オンライン相談

コンサルティング

セミナー

講演

調査

Anthropic、2026年選挙に向けた Claude のセーフガード更新を公表

format_list_bulleted発表内容

ファクトシート

概要

ポイント

関連リンク（公式）

出典

Microsoft 365 CopilotがAnthropicモデルをWordに統合——5月中旬から展開開始

AnthropicがSpaceXのColossus 1スーパーコンピュータ全体を借用——220,000基のNVIDIA GPUへのアクセス確保

Anthropicがクロードの「恐喝」行動をトレーニング改善で解消したと報告

Claude for Excel アドインで月次の財務モデルを 30 分で組む

Claude Code のマルチエージェント・並列実行で長時間タスクを 1 セッションに集約する

Claude 内で QuickBooks / TurboTax を呼び出す統合の使いどころ（米国仕様の現状整理）

5つのご相談入口

無料オンライン相談

コンサルティング

セミナー

講演

調査