
GPT-4oの料金体系を解説 — 未だに使えるレガシーフラッグシップモデル
title: GPT-4oの料金体系を解説 — 未だに使えるレガシーフラッグシップモデル slug: gpt-4o-pricing summary: GPT-4o APIの料金体系を徹底解説 — 10/MTok(短コンテキスト)、自動キャッシュ、Batch API、そしてCrazyrouterによる節約術。 tag: Pricing language: en cover_image_url: https://raw.githubusercontent.com/xujfcn/images/main/blog/covers/claude-sonnet-4-6-pricing.jpg meta_title: GPT-4oの料金体系 2026年版 — レガシーフラッグシップ、キャッシュ、Crazyrouter meta_description: GPT-4oの料金ガイド完全版。入力$2.50/MTok、128Kコンテキスト、キャッシュ、Batch API — さらにCrazyrouter割引。2026年でも堅実な選択肢。 meta_keywords: GPT-4o 料金, OpenAI API コスト, GPT-4o 2026, レガシーモデル, Crazyrouter 割引#
GPT-4oの料金体系を解説 — 未だに使えるレガシーフラッグシップモデル#
GPT-4oは2024年5月にOpenAIのフラッグシップマルチモーダルモデルとして登場しました。高速で高性能であり、GPT-4 Turboよりも大幅に安価でした。登場から約1年間、APIの分野を席巻しました。現在、GPT-5ファミリーが主役となる中、GPT-4oは異なる役割に落ち着いています。それは、何百万もの開発者が今でも毎日頼りにしている、信頼性の高い、実証済みの主力モデルです。
そして正直なところ、多くのユースケースにおいて、今でも賢明な選択肢です。
このガイドでは、2026年におけるGPT-4o APIの料金体系について知っておくべきことすべてを解説します。基本料金、キャッシュ割引、Batch APIによる節約、そしてCrazyrouterがいかにコストをさらに削減できるかについてです。
最終更新日: 2026年4月27日
基本料金#
GPT-4oは、シンプルなトークンごとの料金モデルを採用しています。標準のOpenAI APIでは以下のようになります。
| Component | Price |
|---|---|
| Input tokens | $2.50 / 1M tokens |
| Cached input tokens | $1.25 / 1M tokens |
| Output tokens | $10.00 / 1M tokens |
参考までに、GPT-4oが最初にリリースされたとき、これらの価格はGPT-4 Turbo(30/MTok)から大幅な値下げを意味していました。現在でも、特にキャッシュとバッチ割引を考慮に入れると、競争力のある価格設定を維持しています。
実際の利用例#
約1,000入力トークンと約500出力トークンを含む一般的なAPI呼び出しの費用は、おおよそ以下の通りです。
- Input cost: 1,000 tokens × (0.0025
- Output cost: 500 tokens × (0.005
- Total per call: ~$0.0075
これは、ほとんどの会話型インタラクションで1リクエストあたり1セント未満です。同様のトークン数で1日あたり10,000件の会話を処理するチャットボットの場合、定価で1日あたり約2,250になります。
128Kコンテキストウィンドウ#
GPT-4oは128Kトークンのコンテキストウィンドウをサポートしています。これは、単一のプロンプトで約96,000語、または約300ページ分のテキストに相当します。これはGPT-4 Turboと同じコンテキスト長であり、この価格帯で利用可能な最大級のコンテキストウィンドウの1つです。
128Kトークンには何が収まるでしょうか?
- 小説全体(ほとんどの小説は60K~100K語です)
- 中規模プロジェクトの完全なコードベース
- 数百ページにわたるドキュメント
- 途切れることのない長い会話履歴
主な利点は、GPT-4oが128Kウィンドウのどのくらいを使用しても、トークンあたりの料金が同じであることです。一部の新しいモデルが導入しているような「長コンテキスト追加料金」はありません。1Kトークンを送っても120Kトークンを送っても、入力料金は$2.50/MTokのままです。
このため、GPT-4oは、ドキュメント分析、コードレビュー、長文要約など、大規模なコンテキストを必要とするタスクにおいて特に費用対効果が高くなります。階層型料金設定の新しいモデルでは、実際には費用が高くなる可能性があります。
自動キャッシュ (プロンプトキャッシュ)#
GPT-4oの最も影響力のあるコスト削減機能の1つは、OpenAIの自動プロンプトキャッシュです。2024年後半に導入されたこの機能は、コード変更を一切必要とせず、ただ機能します。
仕組み#
APIにリクエストを送信すると、OpenAIは自動的にプロンプトのプレフィックスをキャッシュします。後続のリクエストが同じプレフィックス(少なくとも1,024トークン)を共有する場合、キャッシュされた部分は50%割引で提供されます。
- Regular input: $2.50 / MTok
- Cached input: $1.25 / MTok
キャッシュは自動です。フラグを設定したり、キャッシュキーを管理したり、API呼び出しを変更したりする必要はありません。OpenAIがサーバー側で処理します。
キャッシュが有効になるケース#
キャッシュは、以下のような場合に最も効果的です。
- リクエスト間で一貫しているシステムプロンプト
- すべての呼び出しに含めるFew-shotの例
- 複数のクエリが参照するドキュメントコンテキスト
- 以前のメッセージが変更されない会話履歴
実際の節約例#
2,000トークンのシステムプロンプトと3,000トークンの製品ドキュメントをすべてのリクエストに含めるカスタマーサポートボットを構築していると想像してください。1日あたり10,000件のリクエストの場合:
キャッシュなしの場合:
- 5,000 tokens × 10,000 requests = 50M input tokens
- Cost: 50 × 125/day
キャッシュありの場合 (システムプロンプト + ドキュメントがキャッシュされる):
- 5,000 cached tokens × 10,000 requests = 50M cached tokens
- Cost: 50 × 62.50/day
- Savings: 1,875/month)
キャッシュは5~10分間の非アクティブ期間で有効期限が切れるため、安定したトラフィックを持つアプリケーションに最適です。バースト的なワークロードの場合、部分的なキャッシュの恩恵が得られます。
Batch API — 50%オフ#
リアルタイム応答を必要としないワークロードにとって、OpenAIのBatch APIは画期的なものです。すべてのトークンコストに対して一律50%の割引を提供します。
| Component | Standard | Batch API |
|---|---|---|
| Input tokens | $2.50 / MTok | $1.25 / MTok |
| Output tokens | $10.00 / MTok | $5.00 / MTok |
Batch APIの仕組み#
個々のリクエストを送信する代わりに、複数のリクエストを含むJSONLファイルをアップロードします。OpenAIはそれらを非同期で処理し、24時間以内に結果を返します(通常ははるかに高速です)。
from openai import OpenAI
client = OpenAI()
# 1. Create a batch input file
batch_input = client.files.create(
file=open("batch_requests.jsonl", "rb"),
purpose="batch"
)
# 2. Submit the batch
batch = client.batches.create(
input_file_id=batch_input.id,
endpoint="/v1/chat/completions",
completion_window="24h"
)
# 3. Check status and retrieve results
batch_status = client.batches.retrieve(batch.id)
print(batch_status.status) # "completed"
Batch APIの最適なユースケース#
- コンテンツ生成 — ブログ記事、製品説明、翻訳
- データ処理 — 大規模データセットの分類、抽出、要約
- 評価パイプライン — プロンプトに対するテストスイートの実行
- 埋め込み生成 — 大規模なドキュメントコレクションの処理
- オフライン分析 — 感情分析、カテゴリ分類
Batch + キャッシュの組み合わせ#
ここからが興味深い点です。Batch APIとプロンプトキャッシュは組み合わせることができます。バッチリクエストが共通のプレフィックスを共有する場合、以下のようになります。
- Batch APIからの50%割引
- キャッシュされた入力トークンに対する追加の50%割引
つまり、バッチ内のキャッシュされた入力はわずか2.50レートから75%の削減になります。
Crazyrouterの料金 — 公式料金から45%オフ#
キャッシュとバッチ処理で既に最適化している場合、もう1つ活用できる手段があります。それは、API呼び出しをCrazyrouter経由でルーティングすることです。
Crazyrouterは、OpenAIの公式料金の55%でGPT-4oを提供します。つまり、すべてのトークンで45%の割引です。
| Component | OpenAI Official | Crazyrouter | Savings |
|---|---|---|---|
| Input tokens | $2.50 / MTok | $1.375 / MTok | 45% off |
| Cached input | $1.25 / MTok | $0.6875 / MTok | 45% off |
| Output tokens | $10.00 / MTok | $5.50 / MTok | 45% off |
Crazyrouterの利用方法#
切り替えは非常に簡単です。base_urlを変更するだけで、既存のコードはそのまま動作します。
Python (OpenAI SDK):
from openai import OpenAI
client = OpenAI(
api_key="your-crazyrouter-api-key",
base_url="https://crazyrouter.com/v1"
)
response = client.chat.completions.create(
model="gpt-4o",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Explain quantum computing in simple terms."}
]
)
print(response.choices[0].message.content)
curl:
curl https://crazyrouter.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer your-crazyrouter-api-key" \
-d '{
"model": "gpt-4o",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Explain quantum computing in simple terms."}
]
}'
Node.js:
import OpenAI from "openai";
const client = new OpenAI({
apiKey: "your-crazyrouter-api-key",
baseURL: "https://crazyrouter.com/v1",
});
const response = await client.chat.completions.create({
model: "gpt-4o",
messages: [
{ role: "system", content: "You are a helpful assistant." },
{ role: "user", content: "Explain quantum computing in simple terms." },
],
});
console.log(response.choices[0].message.content);
これだけです。同じSDK、同じパラメータ、同じ応答形式。異なるのはURLとAPIキーだけです。
Crazyrouterを選ぶ理由#
- 完全なOpenAI API互換性 — ドロップインで置き換え可能、base URL以外のコード変更は不要
- すべてのモデルが利用可能 — GPT-4o、GPT-5.4、o3、o4-miniなど
- 従量課金制 — 最低料金なし、コミットメントなし
- 透明性の高い料金設定 — 表示されている料金が支払う料金です
実際のコスト比較#
実際のシナリオで、すべての節約効果をまとめてみましょう。GPT-4oをカスタマーサポートに利用しているSaaS製品を想像してください。1日あたり50,000件のリクエストを処理し、1リクエストあたり平均2,000入力トークン(うち1,500トークンはキャッシュ済み)、800出力トークンを使用するとします。
月間トークン量:
- 総入力: 50,000 × 2,000 × 30 = 3B tokens (3,000 MTok)
- キャッシュ済み入力: 50,000 × 1,500 × 30 = 2.25B tokens (2,250 MTok)
- 非キャッシュ入力: 750 MTok
- 出力: 50,000 × 800 × 30 = 1.2B tokens (1,200 MTok)
| Scenario | Input Cost | Output Cost | Monthly Total |
|---|---|---|---|
| OpenAI standard (no caching) | 3,000 × 7,500 | 1,200 × 12,000 | $19,500 |
| OpenAI with caching | (750 × 1.25) = $4,687.50 | 1,200 × 12,000 | $16,687.50 |
| Crazyrouter with caching | (750 × 0.6875) = $2,578.13 | 1,200 × 6,600 | $9,178.13 |
| Crazyrouter + Batch API | (750 × 0.34375) = $1,289.06 | 1,200 × 3,300 | $4,589.06 |
4,589へ — これは、キャッシュ、Batch API、Crazyrouterを組み合わせることで76%の削減になります。
Batch API(非同期処理が必要)を使用しない場合でも、Crazyrouterとキャッシュを組み合わせることで、標準のOpenAI料金と比較して**53%**の節約になります。
GPT-5.4にアップグレードすべきか?#
GPT-5.4はOpenAIの現在のフラッグシップモデルであり、GPT-4oよりも優れていることは間違いありません。しかし、「より優れている」ことが常に「より良い価値」を意味するわけではありません。両者を比較してみましょう。
| Feature | GPT-4o | GPT-5.4 |
|---|---|---|
| Input price | $2.50 / MTok | $2.50 / MTok |
| Output price | $10.00 / MTok | $10.00 / MTok |
| Context window | 128K | 1M |
| Max output | 16,384 tokens | 64K tokens |
| Reasoning | Good | Excellent |
| Coding | Strong | Stronger |
| Multimodal | Text + Vision | Text + Vision + Audio |
| Speed | Fast | Comparable |
| Reliability | Battle-tested | Newer, still stabilizing |
| Crazyrouter price (input) | $1.375 / MTok | $1.375 / MTok |
| Crazyrouter price (output) | $5.50 / MTok | $5.50 / MTok |
GPT-4oを使い続けるべき場合#
- 既存のプロンプトが既にうまく機能している場合。 GPT-4oがあなたのユースケースを確実に処理しているなら、切り替えはリスクを伴い、メリットは最小限です。
- 予測可能性が必要な場合。 GPT-4oは2年近く本番環境で稼働しています。その挙動はよく理解されており、安定しています。
- 128Kコンテキストで十分な場合。 ほとんどのアプリケーションは1Mのコンテキストウィンドウを必要としません。
- 出力のコストに敏感な場合。 同じ価格帯で、GPT-4oのより短く簡潔な出力は、GPT-5.4の冗長性が必要ない場合に、実際にはコストを節約できます。
GPT-5.4にアップグレードすべき場合#
- GPT-4oでは不十分な複雑な推論タスク
- 128Kトークンを超える非常に長いドキュメント
- 音声処理の要件
- 品質の違いが重要なコーディングタスク
- 最新の機能が必要で、移行作業を受け入れられる場合
正直な意見として、GPT-4oがあなたにとって機能しているのであれば、急いで移行する必要はありません。GPT-4oは今後も利用可能であり、その価格性能比は依然として優れています。
主要なポイント#
-
GPT-4oは依然として強力な価値提案です。 10/MTokという価格は、特に最先端の推論を必要としないアプリケーションにとって魅力的です。
-
自動キャッシュは無料の節約です。 一貫したプレフィックスを持つプロンプトを設計すれば、コード変更なしでキャッシュされた入力トークンを50%節約できます。
-
Batch APIは非同期ワークロードのすべてを半減させます。 最大24時間の処理時間を許容できるなら、これを使わない手はありません。
-
Crazyrouterはさらに45%の節約を上乗せします。 キャッシュとバッチ処理と組み合わせることで、コストを最大76%削減できます。
-
新しいものがあるからといってアップグレードする必要はありません。 GPT-4oは実証済みで、高速かつ信頼性があります。FOMO(取り残されることへの恐れ)ではなく、ユースケースがそれを要求するときにアップグレードしてください。
Crazyrouterを始める#
GPT-4oのコストを45%削減する準備はできましたか?始めるのに約30秒しかかかりません。
- crazyrouter.comでサインアップ
- ダッシュボードからAPIキーを取得
- base URLを
https://crazyrouter.com/v1に変更 - これだけです。 既存のコードはすぐに動作します。
契約なし。最低料金なし。使った分だけ支払います。
料金情報は2026年4月27日時点のものです。OpenAIはいつでも料金を調整する可能性があります。Crazyrouterの料金は変更される場合があります — 最新の料金についてはcrazyrouter.comをご確認ください。この記事は情報提供のみを目的としており、財務上のアドバイスを構成するものではありません。購入を決定する前に、必ず公式プロバイダーのウェブサイトで現在の料金を確認してください。


