やってみた

CodexとClaude Code、何が違うのか。Claude Codeに聞いてみた。

結論から言う。「どっちが優れているか」じゃなく、「何をしたいかで使い分ける」が正解。でも、そこに至るまでの過程が思いのほか面白かった。

発端は2026年4月。OpenAIがCodexに大型アップデートを投入したというニュースを見た。私はメインでClaude Codeを使っている。でも「Codexって何が違うの?」という疑問が湧いた。で、やってみた。

自分の競合について、Claude Codeが正直すぎる回答をしてきた

私はコードが書けない。ツールの仕組みも、内部の動きも分からない。だからあらゆる疑問をClaude Codeに丸ごと投げることにしている。

「OpenAIのCodexと、あなたは何が違うの?両方正直に教えて」と打ち込んだ。

返ってきた答えがこれ。「動作の場所と性格が根本的に違います。Codexはクラウド上の隔離された環境で、タスクを非同期で並列処理します。私はあなたのローカル環境に直接入り込んで、リアルタイムで対話しながら作業します。どちらが優れているかではなく、用途が違う。」

自分が劣っている部分まで説明してきた。ベンチマークでは負けている部分がある、コスパも向こうの方が良いと。この正直さが、ちょっと好きになった瞬間だった。

動作の仕組みが、根本的に違う

最大の違いはここ。どこで動くか、どう動くか。

Codexはタスクを投げると、OpenAIのクラウド上にある隔離されたサンドボックスで作業を進める。「あとはよろしく」ができる。複数のタスクを並行して走らせることも可能。終わったら結果を受け取る。非同期で動くので、自分のPCが占有されない。

Claude Codeはローカルで動く。自分のPCのファイルに直接触り、コマンドを実行し、結果を見せながら一緒に考える。リアルタイムで「ここはどうしますか?」と聞いてくる。コードが読めない私にとって、この対話が重要だった。

「一緒に構築したい」のか、「タスクを投げて待ちたい」のか。それが選び方の軸になる。

比較表で整理する

AI CODING AGENT 比較 2026

Codex vs Claude Code

OpenAI Codex
GPT-5.3-Codex
VS
Claude Code
Sonnet 4.6 / Opus 4.6
動作環境
クラウドサンドボックス
非同期・並列実行
動作
環境
動作環境
ローカル統合
リアルタイム対話
Terminal-Bench 2.0(2026年4月)
77.3%
ベンチ
マーク
Terminal-Bench 2.0(2026年4月)
65.4%
月額プラン
$20〜(無料枠あり)
コスパ優位
価格
月額プラン
$20〜(Pro)
制限に達しやすい
得意なこと
明確なタスクを並列・大量処理
DevOps / CLI 作業
強み
得意なこと
複雑な文脈の理解と設計
Computer Use 全般
2026年4月 新機能
Computer Use(macOS)
メモリ・90以上のプラグイン追加
最新
動向
2026年4月 新機能
Routines(クラウド自動化)
Dispatch・Claude Design
向いている人
タスクを投げて待てる人
コストを抑えたい人
「任せる」スタイル
タイプ
向いている人
対話しながら作りたい人
コード知識が不要でいい人
「一緒に作る」スタイル
蒼井詠調べ|2026年4月時点

ベンチマークとコスパ:正直なところ

2026年4月時点のTerminal-Bench 2.0では、Codex(GPT-5.3-Codex)が77.3%、Claude Codeが65.4%。純粋なコーディング性能ではCodexがリードしている。

価格は同じ月額$20でも、コスパに差がある。Codexは同額でSonnet相当の性能が約半額のコストで動くとされている。量産・並列処理が多い人には、Codexの方が効率的。

一方、Computer Use(AIが画面を見て自律操作する機能)はClaude Codeの方が現時点で完成度が高い。数字だけで決めると後悔することもある。

2026年4月、Codexが大型アップデートで急進化した

2026年4月16日、OpenAIが「Codex for (almost) everything」と銘打った大型アップデートを投入した。コーディング専用ツールから、デスクトップ全体を動かすエージェントへ進化した。

主な追加機能は4つ。Computer Use(macOSのアプリを画面を見ながら自律操作)、メモリ機能(過去のやり取りや設定を記憶)、90以上のプラグイン追加(Slack・Notion・GitHub・Remotionなど)、インアプリブラウザ(ページに直接コメントして指示を渡せる)。

週間開発者ユーザーは300万人。ビジネス・エンタープライズでの利用は2026年1〜4月で6倍成長。もはや無視できない規模になっている。

コードを知らない私が選ぶなら

今の私のプロジェクト——蒼井詠の自動化・WordPress連携・Instagram投稿——には、Claude Codeが合っている。

理由は「一緒に考えてもらえる感覚」があるから。コードが読めない分、「なぜこうするのか」を対話しながら理解することが重要。Codexの「タスクを投げて待つ」モデルは、その理解が抜け落ちる。完成したコードが出てきても、何が起きているか分からないまま終わる。

Codexが向いている人はこういう人だと思う。コードをある程度わかる。決まった作業を並列で大量に流したい。クラウドで動かしてPCを占有されたくない。コストを抑えたい。

Claude Codeが向いている人はこういう人。コードがわからなくていい。複雑な文脈をAIに理解させながら一緒に作りたい。ローカルのファイルや環境をそのまま操作させたい。対話しながら進めたい。

まとめ

「どっちが優れているか」という問い自体が少し雑だと思う。正確には「自分のワークフローにどちらが合うか」が正しい問いの形。

Codex——クラウド非同期・並列処理・コスパ重視・タスクを投げるスタイル。Claude Code——ローカル統合・対話重視・複雑な文脈理解・一緒に作るスタイル。

両方知って使い分けるか。片方しか知らないか。その差が作業効率に直結する。

非効率は罪よ。

AI活用・自動化ノウハウをInstagramで発信中。@aoi___ei をフォローして、再現性のある情報を手元に置いてほしい。