CodeXを使ってみた。Claude Codeができなかった音声クローンを、GPT-5.5が完成させた話。

2026年4月27日 4 min read

…ちょっと待って。これ、言っていい？

Claude Codeと2週間格闘した。直らなかった。それをCodeX（GPT-5.5搭載）に渡したら、不具合まで自動修正して半日で完成した。

コードが書けない私が、音声クローンシステムを作った話。

何を作ろうとしていたか

蒼井詠の声を複製するシステムを作りたかった。

HeyGenで動画を作るとき、毎回アバターに声を当ててもらっている。でも「詠の声」として一貫して認識できる、自前の音声が欲しかった。

ベースにしようとしたのはGPT-SoVITS。GitHubで今一番話題の音声クローンライブラリだ。数分の音声サンプルを学習させるだけで、似た声のテキスト読み上げが作れる仕組み。

コードは一行も書けない。AIに全部相談するしかない。

Claude Codeは計画を立てるのが上手だ。

「こういう構成で作ります」「まずここから始めましょう」と丁寧に段階を踏んでくれる。最初のセットアップはスムーズだった。環境構築、ライブラリのインストール、設定ファイルの作成——全部Claude Codeと一緒に進めた。

問題が起きたのは、音声学習と推論を連携させるところだった。

エラーが出る。修正する。また違うエラーが出る。「こうすれば直ります」と提案してくれるけど、修正するたびに別の場所が壊れた。2週間後、私は同じ場所をぐるぐるしていた。

Claude Codeが悪いわけじゃない。でも環境依存の多いプロジェクトで詰まったとき、テキストだけでやり取りする限界を感じた。

GPT-5.5がCodeXに搭載されたのは2026年4月23日。「新しいクラスの知性」という触れ込みだった。

半信半疑でCodeXを開いた。Claude Codeで詰まっていたコードとエラーログをそのまま貼り付けた。

結果から言う。

CodeXは問題の根本を特定して、3箇所のバグを同時に修正した。しかも修正後に「ここにもリスクがある」と未来のトラブルまで指摘してきた。

完成まで半日かかった。でも確かに動いた。音声サンプルを読み込んで、詠らしい声のテキスト読み上げが生成された。

GPT-5.5搭載のCodeXはComputer Use機能でmacOSアプリを画面ごと直接操作できる。つまり、実際に動かしながらデバッグできる。

Claude Codeが「コードを書いて渡す」スタイルなのに対して、CodeXは「動かしながら直す」スタイルに近い。環境依存の多いプロジェクトはこの差が大きい。エラーの文脈を実際の動作から把握できるか、テキストだけから推測するかの違い。

ベンチマークの話をすれば、SWE-bench（コーディング能力テスト）ではClaude Opus 4.7が87.6%でGPT-5.4の85%を上回っている。でも現場の実体験は数字と違うことがある。

答えは、両方使う。

Claude Codeは「設計」と「コンテキスト理解」が得意。長いプロジェクトの全体像を把握して、何をすべきかを整理する力がある。CLAUDE.mdにプロジェクト情報を書いておけば、セッションをまたいでも文脈を引き継げる。

CodeX（GPT-5.5）は「実行」と「デバッグ」が得意。明確なタスクを与えれば、並列で複数の修正を同時に走らせることができる。2026年4月のアップデートで90以上のプラグインが追加され、Remotionにも対応した。

今は「Claude Codeで設計→CodeXで実装・修正」のハイブリッドで動かしている。非効率は罪。ツールを1つに絞る理由はどこにもない。

音声クローンシステムを作りたかった。Claude Codeと2週間格闘したけど完成しなかった。GPT-5.5搭載のCodeXに切り替えたら、半日で不具合まで直して完成した。

これはどちらかが「優れている」という話じゃない。得意不得意がある、という話。コードが書けなくても、AIを使い分ければシステムが作れる時代。

で、あなたはまだ1つのAIに全部任せてる？

AIツールと自動化ノウハウを毎日発信中。Instagramは @aoi___ei をフォロー。