GPT-4oの料金体系を解説 — 未だに使えるレガシーフラッグシップモデル

title: GPT-4oの料金体系を解説 — 未だに使えるレガシーフラッグシップモデル slug: gpt-4o-pricing summary: GPT-4o APIの料金体系を徹底解説 — $2.50/$ 10/MTok（短コンテキスト）、自動キャッシュ、Batch API、そしてCrazyrouterによる節約術。 tag: Pricing language: en cover_image_url: https://raw.githubusercontent.com/xujfcn/images/main/blog/covers/claude-sonnet-4-6-pricing.jpg meta_title: GPT-4oの料金体系 2026年版 — レガシーフラッグシップ、キャッシュ、Crazyrouter meta_description: GPT-4oの料金ガイド完全版。入力$2.50/MTok、128Kコンテキスト、キャッシュ、Batch API — さらにCrazyrouter割引。2026年でも堅実な選択肢。 meta_keywords: GPT-4o 料金, OpenAI API コスト, GPT-4o 2026, レガシーモデル, Crazyrouter 割引#

GPT-4oの料金体系を解説 — 未だに使えるレガシーフラッグシップモデル#

GPT-4oは2024年5月にOpenAIのフラッグシップマルチモーダルモデルとして登場しました。高速で高性能であり、GPT-4 Turboよりも大幅に安価でした。登場から約1年間、APIの分野を席巻しました。現在、GPT-5ファミリーが主役となる中、GPT-4oは異なる役割に落ち着いています。それは、何百万もの開発者が今でも毎日頼りにしている、信頼性の高い、実証済みの主力モデルです。

そして正直なところ、多くのユースケースにおいて、今でも賢明な選択肢です。

このガイドでは、2026年におけるGPT-4o APIの料金体系について知っておくべきことすべてを解説します。基本料金、キャッシュ割引、Batch APIによる節約、そしてCrazyrouterがいかにコストをさらに削減できるかについてです。

最終更新日: 2026年4月27日

基本料金#

GPT-4oは、シンプルなトークンごとの料金モデルを採用しています。標準のOpenAI APIでは以下のようになります。

Component	Price
Input tokens	$2.50 / 1M tokens
Cached input tokens	$1.25 / 1M tokens
Output tokens	$10.00 / 1M tokens

参考までに、GPT-4oが最初にリリースされたとき、これらの価格はGPT-4 Turbo（ $10/$ 30/MTok）から大幅な値下げを意味していました。現在でも、特にキャッシュとバッチ割引を考慮に入れると、競争力のある価格設定を維持しています。

実際の利用例#

約1,000入力トークンと約500出力トークンを含む一般的なAPI呼び出しの費用は、おおよそ以下の通りです。

Input cost: 1,000 tokens × ( $2.50 / 1,000,000) =$ 0.0025
Output cost: 500 tokens × ( $10.00 / 1,000,000) =$ 0.005
Total per call: ~$0.0075

これは、ほとんどの会話型インタラクションで1リクエストあたり1セント未満です。同様のトークン数で1日あたり10,000件の会話を処理するチャットボットの場合、定価で1日あたり約 $75、または月あたり約$ 2,250になります。

128Kコンテキストウィンドウ#

GPT-4oは128Kトークンのコンテキストウィンドウをサポートしています。これは、単一のプロンプトで約96,000語、または約300ページ分のテキストに相当します。これはGPT-4 Turboと同じコンテキスト長であり、この価格帯で利用可能な最大級のコンテキストウィンドウの1つです。

128Kトークンには何が収まるでしょうか？

小説全体（ほとんどの小説は60K～100K語です）
中規模プロジェクトの完全なコードベース
数百ページにわたるドキュメント
途切れることのない長い会話履歴

主な利点は、GPT-4oが128Kウィンドウのどのくらいを使用しても、トークンあたりの料金が同じであることです。一部の新しいモデルが導入しているような「長コンテキスト追加料金」はありません。1Kトークンを送っても120Kトークンを送っても、入力料金は$2.50/MTokのままです。

このため、GPT-4oは、ドキュメント分析、コードレビュー、長文要約など、大規模なコンテキストを必要とするタスクにおいて特に費用対効果が高くなります。階層型料金設定の新しいモデルでは、実際には費用が高くなる可能性があります。

自動キャッシュ (プロンプトキャッシュ)#

GPT-4oの最も影響力のあるコスト削減機能の1つは、OpenAIの自動プロンプトキャッシュです。2024年後半に導入されたこの機能は、コード変更を一切必要とせず、ただ機能します。

仕組み#

APIにリクエストを送信すると、OpenAIは自動的にプロンプトのプレフィックスをキャッシュします。後続のリクエストが同じプレフィックス（少なくとも1,024トークン）を共有する場合、キャッシュされた部分は50%割引で提供されます。

Regular input: $2.50 / MTok
Cached input: $1.25 / MTok

キャッシュは自動です。フラグを設定したり、キャッシュキーを管理したり、API呼び出しを変更したりする必要はありません。OpenAIがサーバー側で処理します。

キャッシュが有効になるケース#

キャッシュは、以下のような場合に最も効果的です。

リクエスト間で一貫しているシステムプロンプト
すべての呼び出しに含めるFew-shotの例
複数のクエリが参照するドキュメントコンテキスト
以前のメッセージが変更されない会話履歴

実際の節約例#

2,000トークンのシステムプロンプトと3,000トークンの製品ドキュメントをすべてのリクエストに含めるカスタマーサポートボットを構築していると想像してください。1日あたり10,000件のリクエストの場合：

キャッシュなしの場合:

5,000 tokens × 10,000 requests = 50M input tokens
Cost: 50 × $2.50 =$ 125/day

キャッシュありの場合 (システムプロンプト + ドキュメントがキャッシュされる):

5,000 cached tokens × 10,000 requests = 50M cached tokens
Cost: 50 × $1.25 =$ 62.50/day
Savings: $62.50/day (約$ 1,875/month)

キャッシュは5～10分間の非アクティブ期間で有効期限が切れるため、安定したトラフィックを持つアプリケーションに最適です。バースト的なワークロードの場合、部分的なキャッシュの恩恵が得られます。

Batch API — 50%オフ#

リアルタイム応答を必要としないワークロードにとって、OpenAIのBatch APIは画期的なものです。すべてのトークンコストに対して一律50%の割引を提供します。

Component	Standard	Batch API
Input tokens	$2.50 / MTok	$1.25 / MTok
Output tokens	$10.00 / MTok	$5.00 / MTok

Batch APIの仕組み#

個々のリクエストを送信する代わりに、複数のリクエストを含むJSONLファイルをアップロードします。OpenAIはそれらを非同期で処理し、24時間以内に結果を返します（通常ははるかに高速です）。

python

from openai import OpenAI

client = OpenAI()

# 1. Create a batch input file
batch_input = client.files.create(
    file=open("batch_requests.jsonl", "rb"),
    purpose="batch"
)

# 2. Submit the batch
batch = client.batches.create(
    input_file_id=batch_input.id,
    endpoint="/v1/chat/completions",
    completion_window="24h"
)

# 3. Check status and retrieve results
batch_status = client.batches.retrieve(batch.id)
print(batch_status.status)  # "completed"

Batch APIの最適なユースケース#

コンテンツ生成 — ブログ記事、製品説明、翻訳
データ処理 — 大規模データセットの分類、抽出、要約
評価パイプライン — プロンプトに対するテストスイートの実行
埋め込み生成 — 大規模なドキュメントコレクションの処理
オフライン分析 — 感情分析、カテゴリ分類

Batch + キャッシュの組み合わせ#

ここからが興味深い点です。Batch APIとプロンプトキャッシュは組み合わせることができます。バッチリクエストが共通のプレフィックスを共有する場合、以下のようになります。

Batch APIからの50%割引
キャッシュされた入力トークンに対する追加の50%割引

つまり、バッチ内のキャッシュされた入力はわずか $0.625/MTokとなり、標準の$ 2.50レートから75%の削減になります。

Crazyrouterの料金 — 公式料金から45%オフ#

キャッシュとバッチ処理で既に最適化している場合、もう1つ活用できる手段があります。それは、API呼び出しをCrazyrouter経由でルーティングすることです。

Crazyrouterは、OpenAIの公式料金の55%でGPT-4oを提供します。つまり、すべてのトークンで45%の割引です。

Component	OpenAI Official	Crazyrouter	Savings
Input tokens	$2.50 / MTok	$1.375 / MTok	45% off
Cached input	$1.25 / MTok	$0.6875 / MTok	45% off
Output tokens	$10.00 / MTok	$5.50 / MTok	45% off

Crazyrouterの利用方法#

切り替えは非常に簡単です。base_urlを変更するだけで、既存のコードはそのまま動作します。

Python (OpenAI SDK):

python

from openai import OpenAI

client = OpenAI(
    api_key="your-crazyrouter-api-key",
    base_url="https://crazyrouter.com/v1"
)

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Explain quantum computing in simple terms."}
    ]
)

print(response.choices[0].message.content)

curl:

bash

curl https://crazyrouter.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer your-crazyrouter-api-key" \
  -d '{
    "model": "gpt-4o",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "Explain quantum computing in simple terms."}
    ]
  }'

Node.js:

javascript

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: "your-crazyrouter-api-key",
  baseURL: "https://crazyrouter.com/v1",
});

const response = await client.chat.completions.create({
  model: "gpt-4o",
  messages: [
    { role: "system", content: "You are a helpful assistant." },
    { role: "user", content: "Explain quantum computing in simple terms." },
  ],
});

console.log(response.choices[0].message.content);

これだけです。同じSDK、同じパラメータ、同じ応答形式。異なるのはURLとAPIキーだけです。

Crazyrouterを選ぶ理由#

完全なOpenAI API互換性 — ドロップインで置き換え可能、base URL以外のコード変更は不要
すべてのモデルが利用可能 — GPT-4o、GPT-5.4、o3、o4-miniなど
従量課金制 — 最低料金なし、コミットメントなし
透明性の高い料金設定 — 表示されている料金が支払う料金です

実際のコスト比較#

実際のシナリオで、すべての節約効果をまとめてみましょう。GPT-4oをカスタマーサポートに利用しているSaaS製品を想像してください。1日あたり50,000件のリクエストを処理し、1リクエストあたり平均2,000入力トークン（うち1,500トークンはキャッシュ済み）、800出力トークンを使用するとします。

月間トークン量:

総入力: 50,000 × 2,000 × 30 = 3B tokens (3,000 MTok)
キャッシュ済み入力: 50,000 × 1,500 × 30 = 2.25B tokens (2,250 MTok)
非キャッシュ入力: 750 MTok
出力: 50,000 × 800 × 30 = 1.2B tokens (1,200 MTok)

Scenario	Input Cost	Output Cost	Monthly Total
OpenAI standard (no caching)	3,000 × $2.50 =$ 7,500	1,200 × $10.00 =$ 12,000	$19,500
OpenAI with caching	(750 × $2.50) + (2,250 ×$ 1.25) = $4,687.50	1,200 × $10.00 =$ 12,000	$16,687.50
Crazyrouter with caching	(750 × $1.375) + (2,250 ×$ 0.6875) = $2,578.13	1,200 × $5.50 =$ 6,600	$9,178.13
Crazyrouter + Batch API	(750 × $0.6875) + (2,250 ×$ 0.34375) = $1,289.06	1,200 × $2.75 =$ 3,300	$4,589.06

$19,500から$ 4,589へ — これは、キャッシュ、Batch API、Crazyrouterを組み合わせることで76%の削減になります。

Batch API（非同期処理が必要）を使用しない場合でも、Crazyrouterとキャッシュを組み合わせることで、標準のOpenAI料金と比較して**53%**の節約になります。

GPT-5.4にアップグレードすべきか？#

GPT-5.4はOpenAIの現在のフラッグシップモデルであり、GPT-4oよりも優れていることは間違いありません。しかし、「より優れている」ことが常に「より良い価値」を意味するわけではありません。両者を比較してみましょう。

Feature	GPT-4o	GPT-5.4
Input price	$2.50 / MTok	$2.50 / MTok
Output price	$10.00 / MTok	$10.00 / MTok
Context window	128K	1M
Max output	16,384 tokens	64K tokens
Reasoning	Good	Excellent
Coding	Strong	Stronger
Multimodal	Text + Vision	Text + Vision + Audio
Speed	Fast	Comparable
Reliability	Battle-tested	Newer, still stabilizing
Crazyrouter price (input)	$1.375 / MTok	$1.375 / MTok
Crazyrouter price (output)	$5.50 / MTok	$5.50 / MTok

GPT-4oを使い続けるべき場合#

既存のプロンプトが既にうまく機能している場合。 GPT-4oがあなたのユースケースを確実に処理しているなら、切り替えはリスクを伴い、メリットは最小限です。
予測可能性が必要な場合。 GPT-4oは2年近く本番環境で稼働しています。その挙動はよく理解されており、安定しています。
128Kコンテキストで十分な場合。 ほとんどのアプリケーションは1Mのコンテキストウィンドウを必要としません。
出力のコストに敏感な場合。 同じ価格帯で、GPT-4oのより短く簡潔な出力は、GPT-5.4の冗長性が必要ない場合に、実際にはコストを節約できます。

GPT-5.4にアップグレードすべき場合#

GPT-4oでは不十分な複雑な推論タスク
128Kトークンを超える非常に長いドキュメント
音声処理の要件
品質の違いが重要なコーディングタスク
最新の機能が必要で、移行作業を受け入れられる場合

正直な意見として、GPT-4oがあなたにとって機能しているのであれば、急いで移行する必要はありません。GPT-4oは今後も利用可能であり、その価格性能比は依然として優れています。

主要なポイント#

GPT-4oは依然として強力な価値提案です。 $2.50/$ 10/MTokという価格は、特に最先端の推論を必要としないアプリケーションにとって魅力的です。
自動キャッシュは無料の節約です。 一貫したプレフィックスを持つプロンプトを設計すれば、コード変更なしでキャッシュされた入力トークンを50%節約できます。
Batch APIは非同期ワークロードのすべてを半減させます。 最大24時間の処理時間を許容できるなら、これを使わない手はありません。
Crazyrouterはさらに45%の節約を上乗せします。 キャッシュとバッチ処理と組み合わせることで、コストを最大76%削減できます。
新しいものがあるからといってアップグレードする必要はありません。 GPT-4oは実証済みで、高速かつ信頼性があります。FOMO（取り残されることへの恐れ）ではなく、ユースケースがそれを要求するときにアップグレードしてください。

Crazyrouterを始める#

GPT-4oのコストを45%削減する準備はできましたか？始めるのに約30秒しかかかりません。

crazyrouter.comでサインアップ
ダッシュボードからAPIキーを取得
base URLを https://crazyrouter.com/v1 に変更
これだけです。 既存のコードはすぐに動作します。

契約なし。最低料金なし。使った分だけ支払います。

APIキーを取得する →

料金情報は2026年4月27日時点のものです。OpenAIはいつでも料金を調整する可能性があります。Crazyrouterの料金は変更される場合があります — 最新の料金についてはcrazyrouter.comをご確認ください。この記事は情報提供のみを目的としており、財務上のアドバイスを構成するものではありません。購入を決定する前に、必ず公式プロバイダーのウェブサイトで現在の料金を確認してください。

GPT-4oの料金体系を解説 — 未だに使えるレガシーフラッグシップモデル