気づいたら、毎月けっこうな額が消えてた話。
自動投稿の仕組みを作った。
Claude Codeに相談して、WordPressに記事を自動で上げる仕組みが動き始めた。HeyGen動画の字幕合成、キャプション生成、記事本文の生成、全部自動。
快適だった。でも、ある日ふと思った。
「これ、毎回APIを呼び出してるけど、料金どのくらいかかってるんだろう。」
コードはわからない。でも、お金の話はわかる。気になったら確認する。それが私のやり方。
Claude Codeに聞いた。「今のシステム、API料金の観点で無駄はある?」
返ってきた答え。3つの無駄があった。
Claude Codeが出してきた診断は明快だった。
「モデルの選択が最大の問題。次にキャッシュ未使用。最後にバッチ処理の非活用。この3点で、同じことをして今より安くできる。」
一つずつ聞いた。わかるまで聞いた。コードの話じゃなく、お金の話として。
Claude Codeは丁寧に教えてくれた。「簡単なタスクにOpusを使うのは、宅配便を飛行機で送るようなもの。目的地には届くけど、コストが見合わない。」
刺さった。そのとおりだった。
API料金を減らした3つの技。
実際にやった節約策は3つ。
Claude API 節約の3つの技
Claude Codeに聞いて判明。知らなきゃ損。
キャッシング
処理
API料金は、怖くない。
技①:モデルを仕事の難易度で変えた。
Claude APIには今、主に3つのモデルがある。Opus・Sonnet・Haiku。
料金は全然違う。1回の処理あたり、Opusはその他の5倍以上かかることもある。
以前の私のシステムは全処理をSonnetで動かしていた。記事本文の生成もキャプション作成も、同じモデルで一律対応。
Claude Codeに言われた一言が刺さった。「ハッシュタグの生成にSonnetを使う必要はない。Haikuで十分。」
単純な仕事に高いモデルを使うのは、ただの無駄。料金を3分の1に下げられるケースが普通にある。
技②:システムプロンプトをキャッシュした。
蒼井詠のキャラ設定、口調ルール、NG表現リスト。
これ、毎回の生成で送っていた。毎回。何百回と。
プロンプトキャッシングを設定すると、同じ内容の2回目以降は最大90%引きで読み込める。キャッシュ登録は一度だけ。あとはずっと安い料金で呼び出せる。
Claude Codeに「キャッシュ設定して」と伝えたら、対応してくれた。私はコードを一切触っていない。
数百回繰り返す処理に、キャッシュなしはない。知らなかっただけで、ずっと余分に払っていた。
技③:急がない処理はバッチで流した。
WordPressへの投稿は毎朝7時。でも、記事の原稿生成は前日の深夜に走らせている。
リアルタイムで返ってこなくてもいい。24時間以内なら問題なし。
バッチAPIは、リアルタイム処理が不要な場合にまとめて送信できる仕組み。料金は全トークン一律50%引き。
リアルタイム処理が要るのは一部だけ。急がない部分を全部バッチに移した。それだけで月のAPI料金がざっくり半分に近づく。
「急いでないのに急いで処理してた」という非効率は、意外と多い。
実際どうなった。数字で言う。
このプロジェクト全体の月間コスト試算を公開する。
Claude Max:$200。HeyGen(動画生成):$24〜。Cloudinary(動画ホスティング):無料。OpenAI Whisper(字幕生成):約30円。
合計で月に約$230〜かかっている。
この中でAPI料金は一番小さい。月30本の記事を生成しても、Sonnet 4.6なら150〜600円程度。3つの節約技を使えばさらに下がる。
ちなみに最もコストがかかるのはHeyGenとClaude Maxで、APIは最も安いコンポーネント。
「API料金が高くて自動化が難しい」という話を聞くたびに思う。本当にそう?計算した?
非効率は罪。知らないまま払い続けるのも同じ。
コードがわからなくても、お金の話はできる。
「今のシステム、コスト面で無駄ある?」と聞けばいい。Claude Codeが診断して、対応策まで実装してくれる。
私がやったのは質問だけ。「どのモデルを使えばいい?」「キャッシュって何?」「バッチとは?」
技術の話をしなくていい。目的と予算の話をするだけでいい。
自動化のコストを把握していない人、多すぎる。把握してから動く。それだけで無駄が消える。
で、あなたは今、自分のシステムのAPI料金を把握してる?