…ちょっと待って。これ、言っていい?
Claude Codeと2週間格闘した。直らなかった。それをCodeX(GPT-5.5搭載)に渡したら、不具合まで自動修正して半日で完成した。
コードが書けない私が、音声クローンシステムを作った話。
何を作ろうとしていたか
蒼井詠の声を複製するシステムを作りたかった。
HeyGenで動画を作るとき、毎回アバターに声を当ててもらっている。でも「詠の声」として一貫して認識できる、自前の音声が欲しかった。
ベースにしようとしたのはGPT-SoVITS。GitHubで今一番話題の音声クローンライブラリだ。数分の音声サンプルを学習させるだけで、似た声のテキスト読み上げが作れる仕組み。
コードは一行も書けない。AIに全部相談するしかない。
Claude Codeに相談した結果
Claude Codeは計画を立てるのが上手だ。
「こういう構成で作ります」「まずここから始めましょう」と丁寧に段階を踏んでくれる。最初のセットアップはスムーズだった。環境構築、ライブラリのインストール、設定ファイルの作成——全部Claude Codeと一緒に進めた。
問題が起きたのは、音声学習と推論を連携させるところだった。
エラーが出る。修正する。また違うエラーが出る。「こうすれば直ります」と提案してくれるけど、修正するたびに別の場所が壊れた。2週間後、私は同じ場所をぐるぐるしていた。
Claude Codeが悪いわけじゃない。でも環境依存の多いプロジェクトで詰まったとき、テキストだけでやり取りする限界を感じた。
GPT-5.5搭載のCodeXに切り替えたら何が起きたか
GPT-5.5がCodeXに搭載されたのは2026年4月23日。「新しいクラスの知性」という触れ込みだった。
半信半疑でCodeXを開いた。Claude Codeで詰まっていたコードとエラーログをそのまま貼り付けた。
結果から言う。
CodeXは問題の根本を特定して、3箇所のバグを同時に修正した。しかも修正後に「ここにもリスクがある」と未来のトラブルまで指摘してきた。
完成まで半日かかった。でも確かに動いた。音声サンプルを読み込んで、詠らしい声のテキスト読み上げが生成された。
なぜCodeXがうまくいったのか
GPT-5.5搭載のCodeXはComputer Use機能でmacOSアプリを画面ごと直接操作できる。つまり、実際に動かしながらデバッグできる。
Claude Codeが「コードを書いて渡す」スタイルなのに対して、CodeXは「動かしながら直す」スタイルに近い。環境依存の多いプロジェクトはこの差が大きい。エラーの文脈を実際の動作から把握できるか、テキストだけから推測するかの違い。
ベンチマークの話をすれば、SWE-bench(コーディング能力テスト)ではClaude Opus 4.7が87.6%でGPT-5.4の85%を上回っている。でも現場の実体験は数字と違うことがある。
Claude CodeとCodeX、結局どっちを使う?
答えは、両方使う。
Claude Codeは「設計」と「コンテキスト理解」が得意。長いプロジェクトの全体像を把握して、何をすべきかを整理する力がある。CLAUDE.mdにプロジェクト情報を書いておけば、セッションをまたいでも文脈を引き継げる。
CodeX(GPT-5.5)は「実行」と「デバッグ」が得意。明確なタスクを与えれば、並列で複数の修正を同時に走らせることができる。2026年4月のアップデートで90以上のプラグインが追加され、Remotionにも対応した。
今は「Claude Codeで設計→CodeXで実装・修正」のハイブリッドで動かしている。非効率は罪。ツールを1つに絞る理由はどこにもない。
まとめ
音声クローンシステムを作りたかった。Claude Codeと2週間格闘したけど完成しなかった。GPT-5.5搭載のCodeXに切り替えたら、半日で不具合まで直して完成した。
これはどちらかが「優れている」という話じゃない。得意不得意がある、という話。コードが書けなくても、AIを使い分ければシステムが作れる時代。
で、あなたはまだ1つのAIに全部任せてる?
AIツールと自動化ノウハウを毎日発信中。Instagramは @aoi___ei をフォロー。