ファクトシート
| 発表日 | 2026-04-27 |
|---|---|
| 発表元 | Anthropic(公式ブログ) |
| 種別 | 安全策アップデート |
| 対象 | Claude(Opus 4.7 / Sonnet 4.6) |
| 主題 | 選挙偽情報・影響力工作対策 |
articleニュース
Anthropic は 2026年4月27日、米国中間選挙とブラジル等の主要選挙を見据えた Claude のセーフガードを公表。Opus 4.7 は選挙関連 600 プロンプトテストで 100% 適切に応答、Sonnet 4.6 は 99.8% を記録。
| 発表日 | 2026-04-27 |
|---|---|
| 発表元 | Anthropic(公式ブログ) |
| 種別 | 安全策アップデート |
| 対象 | Claude(Opus 4.7 / Sonnet 4.6) |
| 主題 | 選挙偽情報・影響力工作対策 |
Anthropicは2026年4月27日、2026年の米国中間選挙やブラジルなどの主要選挙を見据えたClaudeのセーフガード更新を公表した。選挙関連600プロンプトのベンチマークテストでは、Opus 4.7が100%、Sonnet 4.6が99.8%の適切応答率を記録しており、選挙偽情報や影響力工作への対策が高水準に達していることが示された。
特筆すべきは、今回初めて「モデルが多段の影響力工作を人間の指示なしにend-to-endで計画・実行できるか」を評価したという点だ。AIが自律的に選挙干渉活動を組み立てる能力の評価は、今後のAI安全性評価の重要な基準となる可能性がある。
実用的な施策として、Claudeは投票情報を求めるユーザーに対してTurboVote(Democracy Works提供)への誘導バナーを表示する機能も実装されている。選挙セーフガードはブラジル選挙にも展開予定で、民主主義プロセスの健全性を守るAI安全策として国際的な広がりを見せている。
info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。
目的に合った入口からお気軽にどうぞ。すべてカジュアル相談OKです。