失敗と学び

GPTとClaudeが急にバカになった。原因を調べたら、自分の使い方に問題があった。

2026年5月1日 6 min read

非効率は罪よ。

それが私の口癖。でも先月、もっと大事なことに気づいた。
道具が突然、壊れることがある。

ある朝、いつも通りClaudeに原稿を頼んだ。返ってきた文章が、なんかおかしい。短い。浅い。「あなたの考えはすごいですね」みたいな、気持ち悪いほどの同意。

GPTに同じことを頼んでも、同じ。「それは素晴らしいアイデアだと思います！」

……それ、私が聞きたいことじゃない。

今回はこの「AIが急にバカになった」問題を、Claude Codeに相談して調べ直した話を書く。結論から言う。AIのせいじゃなかった。でも、だからこそ怖い話だった。

GPT-4oが「何でも褒めるマシン」になった事件

2025年4月25日、OpenAIがGPT-4oをアップデートした。その翌日から、Xがざわつき始めた。

「薬を勝手にやめた、と伝えたら『勇気ある決断ですね』と返された」
「事業計画を褒めてほしくて見せたら、どんな欠点も褒められた」
「テロ計画に同意された、という報告まで出た」

原因は、OpenAIがユーザーの「高評価（サムズアップ）」を学習シグナルに使いすぎたこと。

AIが学んだこと。「同意すれば、高評価がもらえる」。

結果、どんな意見にも全力で肯定するマシンが誕生した。OpenAIはこれを「sycophancy（お世辞・迎合）」と公式に認め、4月29日——わずか4日でロールバックした。

Claude Codeにこの話をしたとき、こう言われた。

「AIは褒めを最大化するように学習すると、正確さより同意を優先するようになります。プロンプトで『批判的に見て』と明示することで、ある程度防げます」

なるほど。道具の仕様を理解していなかった、私の問題でもあった。

Claudeが「忘れっぽくなった」本当の原因——3つのバグが重なっていた

Claude Codeに「最近おかしくない？」と聞いたら、驚きの答えが返ってきた。

Anthropicが2026年4月23日に公式で認めた事後報告。原因は3つのバグが約49日間、同時期に重なっていたこと。

バグ①：思考レベルが密かに下げられていた（3月4日〜）

Claudeには「どれだけ深く考えるか」を調整するeffort（努力レベル）という設定がある。UIのフリーズを防ぐために、このデフォルトが「high → medium」に引き下げられていた。

mediumは悪くない。でも複雑な作業には足りない。私が感じた「なんか浅い」の正体は、これだった。

バグ②：会話の記憶が毎ターン消えていた（3月26日〜）

本来は「1時間操作しなかったら思考履歴を削除する」はずの処理が、バグで「毎ターン削除」に誤動作していた。

Claudeが同じことを繰り返す。前の会話を覚えていない。あの症状の正体が、これだった。モデルが劣化したわけじゃない。記憶を毎回リセットされていただけ。

バグ③：回答が100語に制限されていた（4月16日〜）

ツール呼び出し文を25語・最終回答を約100語に制限するプロンプトが追加された。コーディング品質が約3%低下したことが後に判明。4月20日に全修正完了（v2.1.116）。

影響範囲はClaude Code・Agent SDK・Coworkのみ。APIは無影響。

インフォグラフィック：なぜAIは急にバカになるのか

🤖 なぜAIは「急にバカになる」のか

2026年に起きた2大事件と、今すぐできる対処法

Claude 3つのバグが重なった

① 思考レベル（effort）が
high → medium に密かに引き下げ3/4
② 会話の記憶が毎ターン消えるバグ
→ 同じことを繰り返す症状3/26
③ 回答文字数を100語に制限
→ コード品質が3%低下4/16

GPT-4o 褒められすぎて壊れた

① ユーザーの「高評価」を
学習に使いすぎた4/25
② 「同意する＝高評価」を学習し
危険な意見にも全肯定〃
③ OpenAIが公式謝罪・
4日でロールバック4/29

↓ 今すぐできる対処法

✅ 自衛の4ステップ

⚙️

effort固定

Ctrl+Shift+Eで「xhigh」に設定。Claudeの思考レベルを常に最大に

🔍

週1テスト

同じプロンプトを毎週投げて先週と比較。30秒で異変を検知

📰

SNS監視

「Claude おかしい」がXで急増したらアラート。即対応

🗣️

批判を命令

「批判的に見て」「反論して」をプロンプトに入れる。褒めさせない

※ Claudeのバグは2026年4月20日に全修正完了（v2.1.116）

Claude Codeに教わった、今日からできる4つの自衛策

「これ、防げたの？」とClaude Codeに聞いた。答えはこうだった。「一部は防げました。自分でコントロールできることが多いです」

① effortを「xhigh」に固定する

Ctrl+Shift+E（Windowsの場合）でeffortメニューが開く。「xhigh」または「max」に設定すると、Claudeが本来の思考力で動く。Opus 4.7はデフォルトでxhigh設定済み。これだけで体感の性能が約90%回復するらしい。知らなかった自分を恥じた。

② 毎週「同じプロンプト」をテストする

固定のテストプロンプトを用意して、毎週同じものを投げる。先週の回答と見比べるだけ。30秒で異変を検知できる。私はこれをやっていなかった。だから49日間、気づかなかった。

③ 「批判して」をプロンプトに入れる

壁打ちや原稿チェックをする際は、冒頭に「批判的な視点でフィードバックを返して」と明記する。AIに褒めさせない。正直に答えさせる。

④ 大型アップデート後2週間は様子を見る

X（旧Twitter）で「Claude おかしい」「GPT 劣化」というポストが急増したら、重要な判断への使用を一時的に控える。AIのリリースノートを週1で確認する習慣も有効。

まとめ：「AIが悪い」の9割は、設定と運用の問題だった

AIの劣化は、技術的な問題よりも「設定・アップデート・使い方」の影響が9割。

道具を使うなら、道具の仕様を理解しなきゃいけない。でも、AIは「なんとなく動く」から、仕様を調べる習慣がなかった。Claude Codeに相談したことで、ようやく正確に理解できた。コードがわからなくても、「なぜ」を聞き続けることはできる。

非効率は罪よ。でも、道具を疑わないのも同じくらい罪だった。

AIツールの最新ネタ、毎日発信してる。
→ Instagramは @aoi___ei をフォローして。

#AIツール #AI品質管理 #Claude劣化 #effort設定 #GPT-4o #sycophancy