このノウハウで解決する課題

「AI の出力をそのまま使って、後から数値や引用が間違っていることに気づく」「(もっともらしい嘘)が混じる」「人間レビューに 30 分かかってしまう」。AI 活用の最大の落とし穴です。

結論

1 回の生成で信用せず、「生成 → 自己批評 → 修正」の 3 段階 を 1 で実行させる。所要時間は 30 秒増えるだけで、誤り検出率が劇的に上がります。 / の自己批評能力は実用レベルです。

必要な準備

  • : Claude / ChatGPT(Pro 以上推奨、無料版でも動作)
  • 想定環境: 通常の AI 会話
  • 前提知識: XML タグでのプロンプト構造化(こちら 参照)
  • 自組織・業界の AI 利用規制・(あれば)

手順

1. 3 段階プロンプトのテンプレ

<task>
以下の <document> を要約し、最後に <format> に従って出力してください。

ただし、以下の 3 段階で進めてください:

ステップ 1【ドラフト生成】
通常通り要約を生成する。

ステップ 2【自己批評】
ステップ 1 の出力を自分で読み返し、以下の観点で問題点を 3〜5 件挙げる:
- 数値・固有名詞・日付に誤りがないか
- 元文書にない情報を加えていないか(ハルシネーション)
- 元文書の重要な論点を落としていないか
- 矛盾する記述がないか
- 出力フォーマットに従っているか

ステップ 3【修正版】
ステップ 2 で挙げた問題点を反映した最終版を出力する。
</task>

<document>
(ここに対象文書)
</document>

<format>
(ここに出力フォーマット指定)
</format>

2. 出力構造を「ステップ別に明示」させる

## ステップ 1:ドラフト
(ドラフト本文)

## ステップ 2:自己批評
- 問題点 1:...
- 問題点 2:...
- 問題点 3:...

## ステップ 3:修正版
(最終版)

ステップ 2 が 目に見える ことが重要。ここで問題が指摘されないと、ドラフトをそのまま信用していい指標になります。

3. 重要案件は人間レビューを併用

3 段階プロンプトで誤り検出率は上がりますが 0% にはなりません。重要文書は AI 自己批評 + 人間レビュー の二重チェックを推奨。

4. 業務テンプレに固定

Claude ProjectsChatGPT Projects のカスタム指示に「全ての出力を 3 段階で行う」を組み込めば、毎回プロンプトを書く必要がなくなります。

効果と限界

効果:

  • 単一生成と比べて 誤り発見率が 2〜3 倍(公開研究ベース)
  • 人間レビュー時間が短縮(指摘済み箇所だけ確認すればよい)
  • 出力の 一貫性・論理性 も向上

限界:

  • 出力時間が 1.5〜2 倍 になる(生成 + 批評 + 修正)
  • 自己批評は 完全ではない(同じバイアスを持つため、見落としもある)
  • 短い質問応答には過剰(コスト・時間に見合わない)

応用・派生

  • 複数 AI の相互批評: Claude が生成 → ChatGPT に批評させる → Claude が修正、というクロスチェック
  • 特定観点の批評: 「特に 固有名詞の正確性 だけを批評してください」と観点を絞ると更に精度向上
  • コードレビュー: 同じパターンで → 自己レビュー → 修正で品質向上