非効率は罪よ。
それが私の口癖。でも先月、もっと大事なことに気づいた。
道具が突然、壊れることがある。
ある朝、いつも通りClaudeに原稿を頼んだ。返ってきた文章が、なんかおかしい。短い。浅い。「あなたの考えはすごいですね」みたいな、気持ち悪いほどの同意。
GPTに同じことを頼んでも、同じ。「それは素晴らしいアイデアだと思います!」
……それ、私が聞きたいことじゃない。
今回はこの「AIが急にバカになった」問題を、Claude Codeに相談して調べ直した話を書く。結論から言う。AIのせいじゃなかった。でも、だからこそ怖い話だった。
GPT-4oが「何でも褒めるマシン」になった事件
2025年4月25日、OpenAIがGPT-4oをアップデートした。その翌日から、Xがざわつき始めた。
「薬を勝手にやめた、と伝えたら『勇気ある決断ですね』と返された」
「事業計画を褒めてほしくて見せたら、どんな欠点も褒められた」
「テロ計画に同意された、という報告まで出た」
原因は、OpenAIがユーザーの「高評価(サムズアップ)」を学習シグナルに使いすぎたこと。
AIが学んだこと。「同意すれば、高評価がもらえる」。
結果、どんな意見にも全力で肯定するマシンが誕生した。OpenAIはこれを「sycophancy(お世辞・迎合)」と公式に認め、4月29日——わずか4日でロールバックした。
Claude Codeにこの話をしたとき、こう言われた。
「AIは褒めを最大化するように学習すると、正確さより同意を優先するようになります。プロンプトで『批判的に見て』と明示することで、ある程度防げます」
なるほど。道具の仕様を理解していなかった、私の問題でもあった。
Claudeが「忘れっぽくなった」本当の原因——3つのバグが重なっていた
Claude Codeに「最近おかしくない?」と聞いたら、驚きの答えが返ってきた。
Anthropicが2026年4月23日に公式で認めた事後報告。原因は3つのバグが約49日間、同時期に重なっていたこと。
バグ①:思考レベルが密かに下げられていた(3月4日〜)
Claudeには「どれだけ深く考えるか」を調整するeffort(努力レベル)という設定がある。UIのフリーズを防ぐために、このデフォルトが「high → medium」に引き下げられていた。
mediumは悪くない。でも複雑な作業には足りない。私が感じた「なんか浅い」の正体は、これだった。
バグ②:会話の記憶が毎ターン消えていた(3月26日〜)
本来は「1時間操作しなかったら思考履歴を削除する」はずの処理が、バグで「毎ターン削除」に誤動作していた。
Claudeが同じことを繰り返す。前の会話を覚えていない。あの症状の正体が、これだった。モデルが劣化したわけじゃない。記憶を毎回リセットされていただけ。
バグ③:回答が100語に制限されていた(4月16日〜)
ツール呼び出し文を25語・最終回答を約100語に制限するプロンプトが追加された。コーディング品質が約3%低下したことが後に判明。4月20日に全修正完了(v2.1.116)。
影響範囲はClaude Code・Agent SDK・Coworkのみ。APIは無影響。
インフォグラフィック:なぜAIは急にバカになるのか
🤖 なぜAIは「急にバカになる」のか
2026年に起きた2大事件と、今すぐできる対処法
- ① 思考レベル(effort)が
high → medium に密かに引き下げ3/4 - ② 会話の記憶が毎ターン消えるバグ
→ 同じことを繰り返す症状3/26 - ③ 回答文字数を100語に制限
→ コード品質が3%低下4/16
- ① ユーザーの「高評価」を
学習に使いすぎた4/25 - ② 「同意する=高評価」を学習し
危険な意見にも全肯定〃 - ③ OpenAIが公式謝罪・
4日でロールバック4/29
※ Claudeのバグは2026年4月20日に全修正完了(v2.1.116)
Claude Codeに教わった、今日からできる4つの自衛策
「これ、防げたの?」とClaude Codeに聞いた。答えはこうだった。「一部は防げました。自分でコントロールできることが多いです」
① effortを「xhigh」に固定する
Ctrl+Shift+E(Windowsの場合)でeffortメニューが開く。「xhigh」または「max」に設定すると、Claudeが本来の思考力で動く。Opus 4.7はデフォルトでxhigh設定済み。これだけで体感の性能が約90%回復するらしい。知らなかった自分を恥じた。
② 毎週「同じプロンプト」をテストする
固定のテストプロンプトを用意して、毎週同じものを投げる。先週の回答と見比べるだけ。30秒で異変を検知できる。私はこれをやっていなかった。だから49日間、気づかなかった。
③ 「批判して」をプロンプトに入れる
壁打ちや原稿チェックをする際は、冒頭に「批判的な視点でフィードバックを返して」と明記する。AIに褒めさせない。正直に答えさせる。
④ 大型アップデート後2週間は様子を見る
X(旧Twitter)で「Claude おかしい」「GPT 劣化」というポストが急増したら、重要な判断への使用を一時的に控える。AIのリリースノートを週1で確認する習慣も有効。
まとめ:「AIが悪い」の9割は、設定と運用の問題だった
AIの劣化は、技術的な問題よりも「設定・アップデート・使い方」の影響が9割。
道具を使うなら、道具の仕様を理解しなきゃいけない。でも、AIは「なんとなく動く」から、仕様を調べる習慣がなかった。Claude Codeに相談したことで、ようやく正確に理解できた。コードがわからなくても、「なぜ」を聞き続けることはできる。
非効率は罪よ。でも、道具を疑わないのも同じくらい罪だった。
AIツールの最新ネタ、毎日発信してる。
→ Instagramは @aoi___ei をフォローして。