このノウハウで解決する課題
「AI の出力をそのまま使って、後から数値や引用が間違っていることに気づく」「ハルシネーション(もっともらしい嘘)が混じる」「人間レビューに 30 分かかってしまう」。AI 活用の最大の落とし穴です。
結論
1 回の生成で信用せず、「生成 → 自己批評 → 修正」の 3 段階 を 1 プロンプトで実行させる。所要時間は 30 秒増えるだけで、誤り検出率が劇的に上がります。Claude / ChatGPT の自己批評能力は実用レベルです。
必要な準備
- ツール: Claude / ChatGPT(Pro 以上推奨、無料版でも動作)
- 想定環境: 通常の AI 会話
- 前提知識: XML タグでのプロンプト構造化(こちら 参照)
- 自組織・業界の AI 利用規制・ガイドライン(あれば)
手順
1. 3 段階プロンプトのテンプレ
<task>
以下の <document> を要約し、最後に <format> に従って出力してください。
ただし、以下の 3 段階で進めてください:
ステップ 1【ドラフト生成】
通常通り要約を生成する。
ステップ 2【自己批評】
ステップ 1 の出力を自分で読み返し、以下の観点で問題点を 3〜5 件挙げる:
- 数値・固有名詞・日付に誤りがないか
- 元文書にない情報を加えていないか(ハルシネーション)
- 元文書の重要な論点を落としていないか
- 矛盾する記述がないか
- 出力フォーマットに従っているか
ステップ 3【修正版】
ステップ 2 で挙げた問題点を反映した最終版を出力する。
</task>
<document>
(ここに対象文書)
</document>
<format>
(ここに出力フォーマット指定)
</format>
2. 出力構造を「ステップ別に明示」させる
## ステップ 1:ドラフト
(ドラフト本文)
## ステップ 2:自己批評
- 問題点 1:...
- 問題点 2:...
- 問題点 3:...
## ステップ 3:修正版
(最終版)
ステップ 2 が 目に見える ことが重要。ここで問題が指摘されないと、ドラフトをそのまま信用していい指標になります。
3. 重要案件は人間レビューを併用
3 段階プロンプトで誤り検出率は上がりますが 0% にはなりません。重要文書は AI 自己批評 + 人間レビュー の二重チェックを推奨。
4. 業務テンプレに固定
Claude Projects や ChatGPT Projects のカスタム指示に「全ての出力を 3 段階で行う」を組み込めば、毎回プロンプトを書く必要がなくなります。
効果と限界
効果:
- 単一生成と比べて 誤り発見率が 2〜3 倍(公開研究ベース)
- 人間レビュー時間が短縮(指摘済み箇所だけ確認すればよい)
- 出力の 一貫性・論理性 も向上
限界:
- 出力時間が 1.5〜2 倍 になる(生成 + 批評 + 修正)
- 自己批評は 完全ではない(同じバイアスを持つため、見落としもある)
- 短い質問応答には過剰(コスト・時間に見合わない)
応用・派生
- 複数 AI の相互批評: Claude が生成 → ChatGPT に批評させる → Claude が修正、というクロスチェック
- 特定観点の批評: 「特に 固有名詞の正確性 だけを批評してください」と観点を絞ると更に精度向上
- コードレビュー: 同じパターンでコード生成 → 自己レビュー → 修正で品質向上