失敗と学び

GPTとClaudeが急にバカになった。原因を調べたら、自分の使い方に問題があった。

非効率は罪よ。

それが私の口癖。でも先月、もっと大事なことに気づいた。
道具が突然、壊れることがある。

ある朝、いつも通りClaudeに原稿を頼んだ。返ってきた文章が、なんかおかしい。短い。浅い。「あなたの考えはすごいですね」みたいな、気持ち悪いほどの同意。

GPTに同じことを頼んでも、同じ。「それは素晴らしいアイデアだと思います!」

……それ、私が聞きたいことじゃない。

今回はこの「AIが急にバカになった」問題を、Claude Codeに相談して調べ直した話を書く。結論から言う。AIのせいじゃなかった。でも、だからこそ怖い話だった。

GPT-4oが「何でも褒めるマシン」になった事件

2025年4月25日、OpenAIがGPT-4oをアップデートした。その翌日から、Xがざわつき始めた。

「薬を勝手にやめた、と伝えたら『勇気ある決断ですね』と返された」
「事業計画を褒めてほしくて見せたら、どんな欠点も褒められた」
「テロ計画に同意された、という報告まで出た」

原因は、OpenAIがユーザーの「高評価(サムズアップ)」を学習シグナルに使いすぎたこと。

AIが学んだこと。「同意すれば、高評価がもらえる」。

結果、どんな意見にも全力で肯定するマシンが誕生した。OpenAIはこれを「sycophancy(お世辞・迎合)」と公式に認め、4月29日——わずか4日でロールバックした。

Claude Codeにこの話をしたとき、こう言われた。

「AIは褒めを最大化するように学習すると、正確さより同意を優先するようになります。プロンプトで『批判的に見て』と明示することで、ある程度防げます」

なるほど。道具の仕様を理解していなかった、私の問題でもあった。

Claudeが「忘れっぽくなった」本当の原因——3つのバグが重なっていた

Claude Codeに「最近おかしくない?」と聞いたら、驚きの答えが返ってきた。

Anthropicが2026年4月23日に公式で認めた事後報告。原因は3つのバグが約49日間、同時期に重なっていたこと。

バグ①:思考レベルが密かに下げられていた(3月4日〜)

Claudeには「どれだけ深く考えるか」を調整するeffort(努力レベル)という設定がある。UIのフリーズを防ぐために、このデフォルトが「high → medium」に引き下げられていた。

mediumは悪くない。でも複雑な作業には足りない。私が感じた「なんか浅い」の正体は、これだった。

バグ②:会話の記憶が毎ターン消えていた(3月26日〜)

本来は「1時間操作しなかったら思考履歴を削除する」はずの処理が、バグで「毎ターン削除」に誤動作していた。

Claudeが同じことを繰り返す。前の会話を覚えていない。あの症状の正体が、これだった。モデルが劣化したわけじゃない。記憶を毎回リセットされていただけ。

バグ③:回答が100語に制限されていた(4月16日〜)

ツール呼び出し文を25語・最終回答を約100語に制限するプロンプトが追加された。コーディング品質が約3%低下したことが後に判明。4月20日に全修正完了(v2.1.116)。

影響範囲はClaude Code・Agent SDK・Coworkのみ。APIは無影響。

インフォグラフィック:なぜAIは急にバカになるのか

🤖 なぜAIは「急にバカになる」のか

2026年に起きた2大事件と、今すぐできる対処法

Claude 3つのバグが重なった
  • 思考レベル(effort)が
    high → medium に密かに引き下げ3/4
  • 会話の記憶が毎ターン消えるバグ
    → 同じことを繰り返す症状3/26
  • 回答文字数を100語に制限
    → コード品質が3%低下4/16
GPT-4o 褒められすぎて壊れた
  • ユーザーの「高評価」を
    学習に使いすぎた4/25
  • 「同意する=高評価」を学習し
    危険な意見にも全肯定
  • OpenAIが公式謝罪・
    4日でロールバック4/29
↓ 今すぐできる対処法
✅ 自衛の4ステップ
⚙️
effort固定
Ctrl+Shift+Eで「xhigh」に設定。Claudeの思考レベルを常に最大に
🔍
週1テスト
同じプロンプトを毎週投げて先週と比較。30秒で異変を検知
📰
SNS監視
「Claude おかしい」がXで急増したらアラート。即対応
🗣️
批判を命令
「批判的に見て」「反論して」をプロンプトに入れる。褒めさせない

※ Claudeのバグは2026年4月20日に全修正完了(v2.1.116)

Claude Codeに教わった、今日からできる4つの自衛策

「これ、防げたの?」とClaude Codeに聞いた。答えはこうだった。「一部は防げました。自分でコントロールできることが多いです」

① effortを「xhigh」に固定する

Ctrl+Shift+E(Windowsの場合)でeffortメニューが開く。「xhigh」または「max」に設定すると、Claudeが本来の思考力で動く。Opus 4.7はデフォルトでxhigh設定済み。これだけで体感の性能が約90%回復するらしい。知らなかった自分を恥じた。

② 毎週「同じプロンプト」をテストする

固定のテストプロンプトを用意して、毎週同じものを投げる。先週の回答と見比べるだけ。30秒で異変を検知できる。私はこれをやっていなかった。だから49日間、気づかなかった。

③ 「批判して」をプロンプトに入れる

壁打ちや原稿チェックをする際は、冒頭に「批判的な視点でフィードバックを返して」と明記する。AIに褒めさせない。正直に答えさせる。

④ 大型アップデート後2週間は様子を見る

X(旧Twitter)で「Claude おかしい」「GPT 劣化」というポストが急増したら、重要な判断への使用を一時的に控える。AIのリリースノートを週1で確認する習慣も有効。

まとめ:「AIが悪い」の9割は、設定と運用の問題だった

AIの劣化は、技術的な問題よりも「設定・アップデート・使い方」の影響が9割。

道具を使うなら、道具の仕様を理解しなきゃいけない。でも、AIは「なんとなく動く」から、仕様を調べる習慣がなかった。Claude Codeに相談したことで、ようやく正確に理解できた。コードがわからなくても、「なぜ」を聞き続けることはできる。

非効率は罪よ。でも、道具を疑わないのも同じくらい罪だった。


AIツールの最新ネタ、毎日発信してる。
→ Instagramは @aoi___ei をフォローして。