
GPT-5.4の料金体系を解説 — キャッシュされた入力、コンテキスト階層、Batch API、そしてCrazyrouterで節約する方法
title: GPT-5.4の料金体系を解説 — キャッシュされた入力、コンテキスト階層、Batch API、そしてCrazyrouterで節約する方法 slug: gpt-5-4-pricing summary: GPT-5.4 APIの料金体系を徹底解説 — ショートコンテキストはMTokあたり15、ロングコンテキストは22.50、自動キャッシュは10%のコスト、Batch APIは50%オフ、そしてCrazyrouterで費用を節約する方法。 tag: Pricing language: en cover_image_url: https://raw.githubusercontent.com/xujfcn/images/main/blog/covers/claude-sonnet-4-6-pricing.jpg meta_title: GPT-5.4の料金体系 2026 — コンテキスト階層、キャッシュ、Batch API、Crazyrouter meta_description: GPT-5.4の料金に関する完全ガイド。ショート vs ロングコンテキスト階層、10%コストでの自動キャッシュ、Batch API 50%オフ — さらにCrazyrouterの割引。 meta_keywords: GPT-5.4 pricing, OpenAI API cost, GPT-5.4 API, cached input, Batch API, Crazyrouter discount#
GPT-5.4はOpenAIの現在のフラッグシップモデルであり、GPT-5の後継として、推論、コーディング、マルチモーダル理解の限界をさらに押し広げました。OpenAI API上にアプリケーションを構築している場合、GPT-5.4の料金体系を理解することは、コスト管理と賢明なアーキテクチャ設計を行う上で不可欠です。
このガイドでは、GPT-5.4の料金体系のあらゆる側面を解説します。デュアルコンテキスト階層、入力コストを90%削減する自動キャッシュ、非同期ワークロード向けのBatch API、データレジデンシーオプション、そしてCrazyrouterを介してルーティングすることで各APIコールで45%節約する方法などです。
GPT-5.4がその価格に見合う理由#
数字に入る前に、何に対して料金を支払うのかについて話しましょう。GPT-5.4は、いくつかの主要な分野でGPT-5を大きく上回る飛躍を遂げています。
- 高度な推論: 複雑なタスクにおける精度が向上した多段階の論理推論。ベンチマークでは、MATH、GPQA、ARC-AGIの評価においてGPT-5を一貫して上回る結果を示しています。
- 優れたコーディング: 数十のプログラミング言語にわたる、より強力なコード生成、デバッグ、リファクタリング機能。
- より長いコンテキストウィンドウ: 標準モードで最大270Kトークンをサポートし、ロングコンテキスト階層ではそれをはるかに超える拡張性があります。
- マルチモーダルな流暢さ: テキスト、画像、構造化データを単一の会話でシームレスに処理します。
- 指示への追従性: システムプロンプトや複雑な複数制約の指示に対して、より厳密に追従します。
最高レベルのインテリジェンスを要求する本番環境のアプリケーションにとって、GPT-5.4は競合を凌駕するモデルです。問題は、それが可能かどうかではなく、いかに費用対効果高く利用するかです。
基本料金:ショートコンテキスト vs. ロングコンテキスト#
GPT-5.4は、コンテキスト長に基づいた2段階の料金モデルを採用しています。この2つの階層で料金が大きく異なるため、理解しておくことが重要です。
ショートコンテキスト(標準)#
標準の270Kトークンコンテキストウィンドウ内に収まるリクエストの場合:
| コンポーネント | MTokあたりの価格 |
|---|---|
| Input tokens | $2.50 |
| Cached input tokens | $0.25 |
| Output tokens | $15.00 |
ロングコンテキスト(270Kトークン超)#
リクエストが270Kトークンを超えると、ロングコンテキスト階層が適用され、料金が高くなります。
| コンポーネント | MTokあたりの価格 |
|---|---|
| Input tokens | $5.00 |
| Cached input tokens | $0.50 |
| Output tokens | $22.50 |
実際の意味#
ロングコンテキスト階層は、ショートコンテキストと比較して、入力で2倍、出力で1.5倍の費用がかかります。この料金体系は、可能な限りリクエストを270Kトークン以下に抑えることを推奨しています。
チャットボット、コードアシスタント、コンテンツ生成、データ抽出など、ほとんどのアプリケーションでは、ショートコンテキスト階層に無理なく収まるでしょう。ロングコンテキスト階層は、コードベース全体の分析、長大な法的文書の処理、大規模なデータセットの一括処理といった特殊なユースケース向けに設計されています。
プロのヒント: 定期的にロングコンテキスト階層に達している場合は、ワークロードをより小さなチャンクに分割できるかどうか検討してください。2つの200Kトークンリクエストを処理する方が、1つの400Kトークンリクエストよりも安価です。
自動キャッシュ:繰り返される入力が90%オフ#
ここがGPT-5.4の料金体系が興味深い点であり、コードを一行も変更せずに最も費用を節約できる部分です。
OpenAIの自動キャッシュの仕組み#
AnthropicのClaudeがプロンプト内でcache_controlブレークポイントを手動で設定する必要があるのとは異なり、OpenAIのキャッシュは完全に自動です。仕組みは以下の通りです。
- プレフィックスマッチング: OpenAIのインフラストラクチャは、プロンプトの冒頭が最近送信されたプロンプトと一致する場合を自動的に検出します。
- 自動キャッシュ: 一致が検出されると、キャッシュされた部分はキャッシュされた入力価格で提供されます。これは標準入力コストのわずか**10%**です。
- TTL管理不要: キャッシュの有効期限、キャッシュキー、キャッシュの無効化について心配する必要はありません。OpenAIがすべてサーバー側で処理します。
- コード変更不要: 特別なパラメーターを設定したり、APIフラグを有効にしたりする必要はありません。ただ機能します。
キャッシュの背後にある計算#
すべてのリクエストで送信する5,000トークンのシステムプロンプトがあるとしましょう。キャッシュなしの場合:
- 5,000トークン × 0.0125(システムプロンプトのみ)
自動キャッシュありの場合(最初のリクエスト後):
- 5,000トークン × 0.00125
これはキャッシュされた部分で90%の削減です。数千のリクエストにわたると、これは急速に積み重なります。
キャッシュが有効になる時#
キャッシュは、以下のような場合に最も効果的です。
- 一貫したシステムプロンプト: すべてのリクエストで同じ指示が送信される場合(最も一般的なシナリオ)。
- Few-shotの例: ユーザーの実際のクエリの前に静的な例がある場合。
- ドキュメントコンテキスト: 複数のクエリが同じアップロードされたドキュメントまたはコンテキストブロックを参照する場合。
- 複数ターンの会話: 会話の初期のターンが後続のターンのために自動的にキャッシュされる場合。
ロングコンテキスト階層でのキャッシュ#
キャッシュはロングコンテキスト階層にも適用されます。
- 標準ロングコンテキスト入力: $5.00/MTok
- キャッシュされたロングコンテキスト入力: $0.50/MTok
同じ90%割引です。大規模なドキュメントを扱い、それに対して複数のクエリを実行する場合、ロングコンテキスト階層であってもキャッシュによってコストを劇的に削減できます。
OpenAIのキャッシュ vs. Anthropicのキャッシュ#
| 機能 | OpenAI (GPT-5.4) | Anthropic (Claude) |
|---|---|---|
| 有効化 | 自動 | 手動 (cache_control) |
| コード変更の必要性 | なし | あり |
| TTL管理 | 自動 | 開発者管理 |
| キャッシュ書き込みコスト | なし | 追加料金 |
| キャッシュされたトークンの割引 | 90%オフ | 90%オフ |
OpenAIのアプローチはよりシンプルです。実装のオーバーヘッドなしで節約できます。Anthropicのアプローチはより多くの制御を提供しますが、コード内で明示的なキャッシュ管理が必要です。
Batch API:非同期ワークロードで50%オフ#
ワークロードがリアルタイム応答を必要としない場合、Batch APIは利用可能な最大のコスト削減手段です。
Batch APIの仕組み#
- バッチを送信: 複数のリクエストを含むJSONLファイルをアップロードします。
- 非同期処理: OpenAIは24時間以内にバッチを処理します。
- 結果を取得: 準備ができたら完了した結果をダウンロードします。
Batch APIの料金#
Batch APIは、すべてのトークン価格に対して一律50%の割引を提供します。
| コンポーネント | 標準価格 | バッチ価格 |
|---|---|---|
| ショート入力 | $2.50/MTok | $1.25/MTok |
| ショートキャッシュ入力 | $0.25/MTok | $0.125/MTok |
| ショート出力 | $15.00/MTok | $7.50/MTok |
| ロング入力 | $5.00/MTok | $2.50/MTok |
| ロングキャッシュ入力 | $0.50/MTok | $0.25/MTok |
| ロング出力 | $22.50/MTok | $11.25/MTok |
Batch APIを使用するタイミング#
Batch APIは以下のような場合に最適です。
- 大規模なコンテンツ生成: 製品説明、ブログ記事、マーケティングコピーの一括生成。
- データ処理パイプライン: ドキュメントからの構造化データ抽出、テキスト分類、大規模データセットの要約。
- 評価とテスト: 数百または数千のテストケースにわたるモデル評価の実行。
- 夜間ジョブ: 翌営業日まで待機できるあらゆる処理。
Batch APIの例#
from openai import OpenAI
client = OpenAI()
# Create a batch input file
batch_input = client.files.create(
file=open("batch_requests.jsonl", "rb"),
purpose="batch"
)
# Submit the batch
batch = client.batches.create(
input_file_id=batch_input.id,
endpoint="/v1/chat/completions",
completion_window="24h"
)
# Check status later
status = client.batches.retrieve(batch.id)
print(f"Status: {status.status}")
Batch APIとキャッシュを組み合わせることで、驚くべき節約効果が得られます。バッチリクエストが共通のプレフィックス(システムプロンプトなど)を共有している場合、キャッシュされた部分に対して90%のキャッシュ割引に加えて50%のバッチ割引が適用されます。
データレジデンシー:10%の価格上昇#
データ主権の要件を持つ組織向けに、OpenAIはデータが特定の地理的地域内で処理および保存されることを保証するデータレジデンシーオプションを提供しています。
コスト: すべての標準価格に10%の価格上昇。
| コンポーネント | 標準 | データレジデンシー |
|---|---|---|
| ショート入力 | $2.50/MTok | $2.75/MTok |
| ショート出力 | $15.00/MTok | $16.50/MTok |
| ロング入力 | $5.00/MTok | $5.50/MTok |
| ロング出力 | $22.50/MTok | $24.75/MTok |
データレジデンシーは通常、以下のような場合に必要とされます。
- HIPAAの下でPHIを扱う医療アプリケーション
- 規制データ要件を持つ金融サービス
- 政府および公共部門のアプリケーション
- GDPR準拠の処理を必要とするEU拠点企業
ほとんどの開発者やスタートアップにとって、標準処理で十分です。コンプライアンス要件がそれを要求する場合にのみ、データレジデンシーを選択してください。
Crazyrouterの料金:すべての呼び出しで45%節約#
ここからが本番です。Crazyrouterは、GPT-5.4を**OpenAIの公式料金の55%**で提供します。これは、すべてのAPIコールで45%の割引に相当します。
CrazyrouterのGPT-5.4料金#
| コンポーネント | OpenAI公式 | Crazyrouter (55%) | 節約額 |
|---|---|---|---|
| ショート入力 | $2.50/MTok | $1.375/MTok | $1.125/MTok |
| ショートキャッシュ入力 | $0.25/MTok | $0.1375/MTok | $0.1125/MTok |
| ショート出力 | $15.00/MTok | $8.25/MTok | $6.75/MTok |
| ロング入力 | $5.00/MTok | $2.75/MTok | $2.25/MTok |
| ロングキャッシュ入力 | $0.50/MTok | $0.275/MTok | $0.225/MTok |
| ロング出力 | $22.50/MTok | $12.375/MTok | $10.125/MTok |
Crazyrouter経由でGPT-5.4を使用する方法#
Crazyrouterへの切り替えは約30秒で完了します。base URLを変更するだけで、他はすべて同じです。
Python (OpenAI SDK)#
from openai import OpenAI
client = OpenAI(
api_key="your-crazyrouter-api-key",
base_url="https://crazyrouter.com/v1"
)
response = client.chat.completions.create(
model="gpt-5.4",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Explain quantum computing in simple terms."}
]
)
print(response.choices[0].message.content)
Node.js (OpenAI SDK)#
import OpenAI from "openai";
const client = new OpenAI({
apiKey: "your-crazyrouter-api-key",
baseURL: "https://crazyrouter.com/v1",
});
const response = await client.chat.completions.create({
model: "gpt-5.4",
messages: [
{ role: "system", content: "You are a helpful assistant." },
{ role: "user", content: "Explain quantum computing in simple terms." },
],
});
console.log(response.choices[0].message.content);
cURL#
curl https://crazyrouter.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer your-crazyrouter-api-key" \
-d '{
"model": "gpt-5.4",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Explain quantum computing in simple terms."}
]
}'
Crazyrouterがより低価格を提供できる理由#
Crazyrouterは、数千の開発者からの需要を集約するOpenAI互換のAPIゲートウェイです。トラフィックを効率的にルーティングし、ボリューム価格を交渉することで、Crazyrouterは節約分を直接お客様に還元します。同じGPT-5.4モデル、同じAPI互換性、同じ応答品質を、より低価格で利用できます。
主なメリット:
- 完全なOpenAI API互換性: ドロップインで置き換え可能。base URL以外のコード変更は不要です。
- 同じモデル、同じ品質: リクエストはOpenAIのインフラストラクチャにルーティングされます。本物のGPT-5.4を利用できます。
- 自動キャッシュは引き続き機能: OpenAIのサーバー側キャッシュは、APIへのアクセス方法に関わらず適用されます。
- コミットメント不要: 従量課金制で、最低利用額はありません。
実世界のコスト比較:3つのシナリオ#
これらの数字を、3つの現実的な使用シナリオで具体的に見てみましょう。
シナリオ1:SaaSチャットボット(カスタマーサポート)#
月間50,000件の会話を処理するカスタマーサポートチャットボット。
前提条件:
- システムプロンプト:2,000トークン(最初のリクエスト後にキャッシュ)
- 平均ユーザーメッセージ:200トークン
- 平均応答:500トークン
- 平均3ターン/会話
月間トークン使用量:
- 入力トークン:50,000 × 3 × 200 = 30Mトークン(ユーザーメッセージ)
- キャッシュされた入力:50,000 × 3 × 2,000 = 300Mトークン(システムプロンプト、キャッシュ済み)
- 出力トークン:50,000 × 3 × 500 = 75Mトークン
| プロバイダー | 入力コスト | キャッシュコスト | 出力コスト | 月間合計 |
|---|---|---|---|---|
| OpenAI Direct | $75.00 | $75.00 | $1,125.00 | $1,275.00 |
| Crazyrouter | $41.25 | $41.25 | $618.75 | $701.25 |
Crazyrouterでの節約額:月間6,885)
シナリオ2:コードレビューパイプライン(Batch API)#
500件のプルリクエストに対して夜間コードレビューを実行するエンジニアリングチーム。
前提条件:
- 平均PRコンテキスト:8,000トークン
- システムプロンプト:3,000トークン(キャッシュ済み)
- 平均レビュー出力:1,500トークン
- Batch APIを使用(50%オフ)
月間トークン使用量(22営業日):
- 入力トークン:500 × 22 × 8,000 = 88Mトークン
- キャッシュされた入力:500 × 22 × 3,000 = 33Mトークン
- 出力トークン:500 × 22 × 1,500 = 16.5Mトークン
| プロバイダー | 入力コスト | キャッシュコスト | 出力コスト | 月間合計 |
|---|---|---|---|---|
| OpenAI Batch | $110.00 | $4.13 | $123.75 | $237.88 |
| Crazyrouter + Batch | $60.50 | $2.27 | $68.06 | $130.83 |
Crazyrouterでの節約額:月間1,284.60)
シナリオ3:ドキュメント分析(ロングコンテキスト)#
月間200件の契約書を分析するリーガルテック企業。各契約書はロングコンテキスト階層を必要とする。
前提条件:
- 平均ドキュメント:300Kトークン(ロングコンテキスト階層)
- システムプロンプト:5,000トークン(キャッシュ済み)
- 平均分析出力:3,000トークン
- ドキュメントあたりの複数クエリ:各5クエリ
月間トークン使用量:
- 入力トークン:200 × 300,000 = 60Mトークン(ドキュメントあたりの初回クエリ)
- キャッシュされた入力:200 × 4 × 300,000 = 240Mトークン(後続クエリ)
- キャッシュされたシステムプロンプト:200 × 5 × 5,000 = 5Mトークン
- 出力トークン:200 × 5 × 3,000 = 3Mトークン
| プロバイダー | 入力コスト | キャッシュコスト | 出力コスト | 月間合計 |
|---|---|---|---|---|
| OpenAI Direct | $300.00 | $122.50 | $67.50 | $490.00 |
| Crazyrouter | $165.00 | $67.38 | $37.13 | $269.50 |
Crazyrouterでの節約額:月間2,646)
GPT-5.4 vs. 競合:料金比較#
GPT-5.4は、他のフロンティアモデルと比較して、料金面でどうでしょうか?
GPT-5.4 vs. Claude Sonnet 4.6#
| GPT-5.4 | Claude Sonnet 4.6 | |
|---|---|---|
| 入力 | $2.50/MTok | $3.00/MTok |
| 出力 | $15.00/MTok | $15.00/MTok |
| キャッシュされた入力 | $0.25/MTok | $0.30/MTok |
| キャッシュ方法 | 自動 | 手動 (cache_control) |
| 最大コンテキスト | 270K+ (tiered) | 200K |
| Batch API | 50%オフ | 50%オフ |
評価: GPT-5.4は入力トークンがわずかに安く、実装がよりシンプルな自動キャッシュを提供します。Claude Sonnet 4.6はよりきめ細かなキャッシュ制御を提供しますが、コード変更が必要です。出力料金は同じです。純粋なコスト最適化の観点からは、GPT-5.4がわずかに優位です。特に、手間のかからないキャッシュを重視する場合に顕著です。
GPT-5.4 vs. Gemini 3.1 Pro#
| GPT-5.4 | Gemini 3.1 Pro | |
|---|---|---|
| 入力 | $2.50/MTok | $1.25/MTok |
| 出力 | $15.00/MTok | $10.00/MTok |
| キャッシュされた入力 | $0.25/MTok | $0.3125/MTok |
| 最大コンテキスト | 270K+ (tiered) | 1M+ |
| Batch API | 50%オフ | N/A |
評価: Gemini 3.1 Proは基本料金が安く、大規模なコンテキストウィンドウを提供します。しかし、GPT-5.4は一般的に、複雑な推論タスク、コーディングベンチマーク、指示への追従性において優れた性能を発揮します。Batch APIの割引も、非同期ワークロードにおいてGPT-5.4に優位性をもたらします。品質要件に基づいて選択してください。Gemini 3.1 Proが品質基準を満たすのであれば、より経済的な選択肢です。最高のパフォーマンスが必要な場合は、GPT-5.4がそのプレミアムに見合うでしょう。
モデル全体におけるCrazyrouterの利点#
注目すべき点として、CrazyrouterはGPT-5.4だけでなく、すべての主要モデルで割引料金を提供しています。スタックで複数のモデルを使用している場合、すべてをCrazyrouter経由でルーティングすることで、請求が簡素化され、全体的な節約が最大化されます。
主要なポイント#
-
2つのコンテキスト階層が重要: 可能な限りリクエストを270Kトークン以下に抑えましょう。ロングコンテキスト階層は1.5~2倍の費用がかかります。
-
キャッシュは無料のお金: OpenAIの自動キャッシュは、コード変更なしで繰り返されるプロンプトプレフィックスに対して90%の割引を提供します。キャッシュヒットを最大化するために、一貫したプレフィックスを持つプロンプトを設計しましょう。
-
非同期作業にはBatch API: リアルタイム応答を必要としない場合、Batch APIはすべての料金を半額にします。キャッシュと組み合わせることで最大の節約効果が得られます。
-
データレジデンシーは必要な場合のみ: コンプライアンスのためには10%の価格上昇も価値がありますが、不要であればスキップしましょう。
-
Crazyrouterは45%節約: 同じモデル、同じAPI、同じ品質を、base URLを変更するだけで、すべての呼び出しで節約できます。
-
割引を重ねる: キャッシュ + Batch API + Crazyrouterを組み合わせることで、標準のOpenAI料金と比較して実質コストを70~80%削減できます。
今すぐGPT-5.4の費用を節約しましょう#
GPT-5.4のコストを45%削減する準備はできていますか?Crazyrouterの利用開始は1分もかかりません。
- crazyrouter.comでサインアップし、APIキーを取得してください。
- base URLを
https://crazyrouter.com/v1に変更してください。 - それだけです。 既存のコードはそのまま動作します。SDKの変更も、移行の煩わしさもありません。
Crazyrouterは、GPT-5.4だけでなく、OpenAI、Anthropic、Googleなど200以上のモデルを、単一の統合APIを通じてサポートしています。従量課金制で、最低利用額やコミットメントはありません。
最終更新日: 2026年4月27日
免責事項:料金情報は、公開日時点でのOpenAIからの公開データに基づいています。料金は変更される可能性があります。Crazyrouterの料金は現在のレートに基づいており、調整される場合があります。購入を決定する前に、必ず各プロバイダーのウェブサイトで現在の料金を確認してください。この記事は情報提供のみを目的としており、財務上のアドバイスを構成するものではありません。


