
GPT-5-nanoの料金体系を解説 — 高スループットワークロード向けの最安価なGPTモデル
title: GPT-5-nanoの料金体系を解説 — 高スループットワークロード向けの最安価なGPTモデル slug: gpt-5-nano-pricing summary: GPT-5-nano APIの料金体系を徹底解説 — わずか1.25/MTok、自動キャッシュ、Batch API 50%オフ、Crazyrouterによる割引。 tag: Pricing language: en cover_image_url: https://raw.githubusercontent.com/xujfcn/images/main/blog/covers/claude-sonnet-4-6-pricing.jpg meta_title: GPT-5-nano料金2026 — 最安価なGPTモデルとCrazyrouter meta_description: GPT-5-nanoの料金ガイド。入力はわずか$0.20/MTok — 最安価なGPTモデル。キャッシュ、Batch API — さらにCrazyrouter割引。 meta_keywords: GPT-5-nano pricing, cheapest AI API, OpenAI nano model, high throughput AI, Crazyrouter discount#
GPT-5-nanoの料金体系を解説 — 高スループットワークロード向けの最安価なGPTモデル#
OpenAIのGPT-5-nanoは、GPT-5ファミリーの中で最も小さく、最も安価なモデルであり、深い推論よりも速度とコストが重視される高スループットのワークロード向けに特別に構築されています。入力トークン100万あたりわずか1.25という価格は、これまでにリリースされたGPTモデルの中で最も手頃な価格であり、Crazyrouterを通じてさらに安く利用できます。
分類パイプラインの実行、大規模なコンテンツフィルタリング、1日あたり数百万件のリクエストに対する意図ルーティングなど、GPT-5-nanoはGPTレベルのインテリジェンスをはるかに低いコストで提供します。このガイドでは、すべての料金ティア、割引メカニズム、および実際のコストシナリオを詳しく説明し、自信を持って予算を計画できるようにします。
基本料金#
GPT-5-nanoは、OpenAIの標準的なトークンごとの料金モデルに従います。公式料金表は以下のとおりです。
| ティア | 入力 | 出力 |
|---|---|---|
| 標準 | $0.20 / MTok | $1.25 / MTok |
| キャッシュされた入力 | $0.02 / MTok | — |
| Batch API | $0.10 / MTok | $0.625 / MTok |
主な詳細:
- 長文コンテキスト料金ティアなし — GPT-5-nanoは固定のコンテキストウィンドウを持ち、より大きなモデルが拡張コンテキストに対して課すプレミアム料金はありません。
- トークンごとの支払い — 実際に使用したトークンに対してのみ課金されます。最低利用料金や予約容量料金はありません。
- 同じ請求インフラストラクチャ — 既存のOpenAIの請求設定、使用ティア、レート制限で動作します。
これを具体的に見てみましょう。100万トークンの入力を処理するのにかかる費用はわずか$0.20です。これは約75万語のテキストを20セントで処理できることになります。出力が短い(単一のラベルやスコアなど)分類やルーティングタスクの場合、リクエストあたりの実質的なコストは1セント未満にまで下がります。
自動キャッシュ#
GPT-5-nanoの最も強力なコスト削減機能の1つは、自動プロンプトキャッシュです。OpenAIは頻繁に使用されるプロンプトのプレフィックスを自動的にキャッシュし、キャッシュされたトークンに対しては標準入力料金のわずか10%しか課金しません。
仕組み#
- キャッシュされた入力トークン: $0.02 / MTok (標準入力と比較して90%割引)
- 自動 — 設定は不要です。OpenAIは繰り返されるプロンプトのプレフィックスを検出し、透過的にキャッシュします。
- キャッシュヒットは、リクエストが共通のシステムプロンプトまたは少なくとも1,024トークンのプレフィックスを共有する場合に発生します。
キャッシュが最も効果を発揮するケース#
キャッシュは、以下のようなワークロードで最も効果的です。
- 長いシステムプロンプト — 詳細なシステムプロンプト(分類ルール、出力スキーマ、few-shot例など)を使用する場合、そのプレフィックスは最初のリクエスト後にキャッシュされます。
- バッチ分類 — 同じ分類パイプラインに数千のアイテムを送る場合、システムプロンプトの全入力料金を支払うのは最初のリクエストのみです。
- 一貫したプレフィックス — プロンプトの最初のNトークンがすべてのリクエストで同じままであるワークフロー。
コスト影響の例#
2,000トークンのシステムプロンプトを使用し、1日あたり100,000件のアイテムを処理する分類パイプラインを想像してください。各アイテムには200トークンのユーザー入力があります。
- キャッシュなし: (2,000 + 200) × 100,000 = 220M入力トークン → $44.00/日
- キャッシュあり: (2,000 × 0.20/MTok) × 100,000 = 4.00 = $8.00/日
これは、自動キャッシュだけで入力コストが82%削減されることを意味します — コード変更は一切不要です。
Batch API#
リアルタイム応答を必要としないワークロードの場合、OpenAIのBatch APIは入力トークンと出力トークンの両方で一律50%割引を提供します。
Batch APIの料金#
| トークンタイプ | 標準 | Batch API | 割引額 |
|---|---|---|---|
| 入力 | $0.20 / MTok | $0.10 / MTok | 50%オフ |
| 出力 | $1.25 / MTok | $0.625 / MTok | 50%オフ |
Batch APIの仕組み#
- バッチを送信 — 最大50,000件のリクエストを含むJSONLファイルをアップロードします。
- 処理を待つ — バッチは24時間以内に完了します(通常ははるかに高速です)。
- 結果を取得 — 完了したバッチをすべての応答とともにダウンロードします。
Batch + GPT-5-nanoの理想的なユースケース#
- 夜間コンテンツモデレーション — 1日分のユーザー生成コンテンツを夜間に一括処理します。
- 一括分類 — 数百万の製品、チケット、またはドキュメントを分類します。
- データエンリッチメント — 大規模なデータセットにラベル、要約、またはメタデータを追加します。
- 評価パイプライン — モデルの出力をスコアリングしたり、トレーニングデータの品質チェックを実行したりします。
Batch API + キャッシュの組み合わせ#
はい、キャッシュはBatch APIでも機能します。バッチリクエストが共通のプレフィックスを共有している場合、両方の割引が適用されます。
- バッチモードでのキャッシュされた入力: 実質**0.02のキャッシュ料金に50%のバッチ割引が適用)
- これは標準入力料金よりも95%安いことになります。
Crazyrouterの料金#
Crazyrouterを通じて、GPT-5-nanoをOpenAIの公式料金の**55%**で利用できます — レート制限の削減や機能制限なしで45%割引です。
Crazyrouterの料金#
| トークンタイプ | OpenAI公式 | Crazyrouter | 節約額 |
|---|---|---|---|
| 入力 | $0.20 / MTok | $0.11 / MTok | 45% |
| 出力 | $1.25 / MTok | $0.6875 / MTok | 45% |
Crazyrouterが安価な理由#
Crazyrouterは何千もの開発者からの需要を集約し、OpenAIと大量購入価格を交渉し、その節約分を直接お客様に還元します。これにより、以下が得られます。
- 同じモデル、同じ品質 — OpenAIを直接呼び出すのと同一の出力
- OpenAI互換API — ドロップインで置き換え可能、コード変更不要
- レート制限のペナルティなし — 直接アクセスと同じスループット
- 従量課金制 — 最低利用料金なし、コミットメントなし
コード例: OpenAI Python SDK#
from openai import OpenAI
client = OpenAI(
api_key="your-crazyrouter-api-key",
base_url="https://crazyrouter.com/v1"
)
response = client.chat.completions.create(
model="gpt-5-nano",
messages=[
{"role": "system", "content": "Classify the following text into one of: positive, negative, neutral."},
{"role": "user", "content": "This product exceeded my expectations in every way!"}
],
max_tokens=10
)
print(response.choices[0].message.content)
# Output: positive
コード例: cURL#
curl https://crazyrouter.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer your-crazyrouter-api-key" \
-d '{
"model": "gpt-5-nano",
"messages": [
{"role": "system", "content": "Classify sentiment: positive, negative, or neutral."},
{"role": "user", "content": "Terrible experience, would not recommend."}
],
"max_tokens": 10
}'
コード例: Node.js#
import OpenAI from 'openai';
const client = new OpenAI({
apiKey: 'your-crazyrouter-api-key',
baseURL: 'https://crazyrouter.com/v1',
});
const response = await client.chat.completions.create({
model: 'gpt-5-nano',
messages: [
{ role: 'system', content: 'Extract the intent: greeting, question, complaint, or other.' },
{ role: 'user', content: 'Hey, can you help me reset my password?' },
],
max_tokens: 10,
});
console.log(response.choices[0].message.content);
// Output: question
実際のコスト比較#
GPT-5-nanoの料金が実際の運用でどのように機能するかを見るために、3つの超大容量シナリオを見てみましょう。
シナリオ1: 1日あたり100Mトークン — テキスト分類#
ユースケース: Eコマースプラットフォームが、1日あたり500,000件の商品レビューを感情カテゴリに分類します。
- 平均入力: 150トークン(レビュー)+ 50トークン(システムプロンプト)= 200トークン/リクエスト
- 平均出力: 5トークン(ラベル)
- 1日あたりのボリューム: 500,000リクエスト → 100M入力トークン、2.5M出力トークン
| プロバイダー | 1日あたりの入力コスト | 1日あたりの出力コスト | 月額合計 |
|---|---|---|---|
| OpenAI直接 | $20.00 | $3.13 | $694 |
| OpenAI + キャッシュ | $4.00 | $3.13 | $214 |
| Crazyrouter | $11.00 | $1.72 | $382 |
| Crazyrouter + キャッシュ | $2.20 | $1.72 | $118 |
| Batch API (OpenAI) | $10.00 | $1.56 | $347 |
| Batch API (Crazyrouter) | $5.50 | $0.86 | $191 |
最良の選択肢: 1日あたり100Mトークンの分類で、Crazyrouter + キャッシュを利用すると月額$118。
シナリオ2: 1日あたり200Mトークン — コンテンツフィルタリング#
ユースケース: ソーシャルメディアプラットフォームが、1日あたり200万件の投稿をポリシー違反のためにフィルタリングします。
- 平均入力: 80トークン(投稿)+ 500トークン(ポリシー規則)= 580トークン/リクエスト(ただし500トークンはキャッシュ済み)
- 平均出力: 20トークン(判定 + 理由)
- 1日あたりのボリューム: 2,000,000リクエスト → 約160M未キャッシュ + 1Bキャッシュ済み入力トークン、40M出力トークン
| プロバイダー | 1日あたりのコスト | 月額コスト |
|---|---|---|
| OpenAI直接 | $82.00 | $2,460 |
| OpenAI + キャッシュ | $52.00 | $1,560 |
| Crazyrouter + キャッシュ | $28.60 | $858 |
| Batch + Crazyrouter | $14.30 | $429 |
最良の選択肢: レイテンシが許容される場合、Crazyrouter経由のBatch APIを利用すると、1日あたり200万件のコンテンツモデレーション決定に対して月額$429に抑えられます。
シナリオ3: 1日あたり50Mトークン — 意図ルーティング#
ユースケース: カスタマーサービスプラットフォームが、1日あたり100万件の受信メッセージを適切な部署にルーティングします。
- 平均入力: 30トークン(メッセージ)+ 200トークン(ルーティングルール)= 230トークン/リクエスト(200トークンはキャッシュ済み)
- 平均出力: 10トークン(部署 + 信頼度)
- 1日あたりのボリューム: 1,000,000リクエスト → 30M新規 + 200Mキャッシュ済み入力トークン、10M出力トークン
| プロバイダー | 1日あたりのコスト | 月額コスト |
|---|---|---|
| OpenAI直接 | $18.50 | $555 |
| OpenAI + キャッシュ | $10.00 | $300 |
| Crazyrouter + キャッシュ | $5.50 | $165 |
最良の選択肢: サブ秒のレイテンシで1日あたり100万件のルーティング決定を行う場合、Crazyrouter + キャッシュを利用すると月額$165。
GPT-5-nano vs Gemini 2.5 Flash-Lite vs Claude Haiku#
GPT-5-nanoは、競合プロバイダーの他の予算ティアモデルと比較してどうでしょうか?
| 機能 | GPT-5-nano | Gemini 2.5 Flash-Lite | Claude 3.5 Haiku |
|---|---|---|---|
| 入力料金 | $0.20 / MTok | $0.075 / MTok | $0.80 / MTok |
| 出力料金 | $1.25 / MTok | $0.30 / MTok | $4.00 / MTok |
| キャッシュされた入力 | $0.02 / MTok | $0.01875 / MTok | $0.08 / MTok |
| バッチ割引 | 50%オフ | 利用不可 | 利用不可 |
| コンテキストウィンドウ | 128K | 1M | 200K |
| 速度 | 非常に高速 | 非常に高速 | 高速 |
| 最適な用途 | 分類、ルーティング | 長文コンテキストの安価なタスク | 品質/コストのバランス |
比較からの主要なポイント#
- Gemini 2.5 Flash-Liteは、トークン単価では理論上安価ですが、Batch API割引がなく、高スループットのワークロードではレイテンシが予測しにくいです。
- Claude 3.5 Haikuはより優れた推論品質を提供しますが、入力で4倍、出力で3.2倍のコストがかかります — 単純な分類タスクには過剰です。
- GPT-5-nanoは、OpenAIエコシステムユーザーにとって最適な選択肢です。最安価なGPTモデル、優れたBatch APIサポート、自動キャッシュ、そして大規模での実績ある信頼性を提供します。
GPT-5-nanoを選択すべき時#
- すでにOpenAIエコシステムを利用しており、最も安価なオプションを求めている場合
- タスクが単純な場合: 分類、ルーティング、抽出、フィルタリング
- オフライン処理のためにBatch APIが必要な場合
- 設定なしで自動キャッシュを利用したい場合
- OpenAI APIの信頼性とツールを重視する場合
代替案を検討すべき時#
- 1M以上のコンテキストウィンドウが必要な場合 → Gemini 2.5 Flash-Lite
- 予算内でより強力な推論が必要な場合 → Claude 3.5 Haiku
- エコシステムへのこだわりがなく、純粋にトークンコストを最適化したい場合 → Gemini 2.5 Flash-Lite
主要なポイント#
-
入力1.25/MTok — GPT-5-nanoは、現時点で利用可能なGPTモデルの中で最も安価です。
-
自動キャッシュにより入力コストを90%削減 — 設定は不要です。繰り返されるプレフィックスは自動的に$0.02/MTokでキャッシュされます。
-
Batch APIで50%節約 — リアルタイムではないワークロードの場合、バッチを送信すると入力と出力の両方で半額になります。
-
Crazyrouterでさらに45%節約 — Crazyrouterのボリューム価格設定により、機能制限なしでGPT-5-nanoを$0.11/MTokの入力で利用できます。
-
割引を重ねる — キャッシュ + バッチ + Crazyrouterを組み合わせると、バッチモードでのキャッシュされた入力の実質コストを$0.01/MTok未満に抑えることができます。
-
大量処理向けに構築 — GPT-5-nanoは最も賢いモデルを目指しているわけではありません。深い推論を必要としないタスクにおいて、最速かつ最も安価であることを目指しています。
CrazyrouterでGPT-5-nanoを始める#
GPT-5-nanoを45%オフで実行する準備はできましたか?開始まで1分もかかりません。
- crazyrouter.comでサインアップ
- ダッシュボードからAPIキーを取得
- SDKを
https://crazyrouter.com/v1に設定 - モデル
gpt-5-nanoを使用 — これだけです。同じAPI、同じ応答、より低い料金。
契約なし。最低利用料金なし。使用した分だけ支払います。
最終更新日: 2026年4月27日
免責事項: 料金情報は、公開日時点でのOpenAIからの公開データに基づいています。料金は予告なく変更される場合があります。Crazyrouterの料金は、crazyrouter.comの利用規約に従います。購入を決定する前に、必ず各プロバイダーの料金ページで現在の料金を確認してください。


