Login
Back to Blog
GPT-5-miniの料金体系を解説 — キャッシュとバッチ割引で超低コストAIを実現

GPT-5-miniの料金体系を解説 — キャッシュとバッチ割引で超低コストAIを実現

C
Crazyrouter Team
April 27, 2026
0 views日本語Pricing
Share:


title: GPT-5-miniの料金体系を解説 — キャッシュとバッチ割引で超低コストAIを実現 slug: gpt-5-mini-pricing summary: GPT-5-mini APIの料金体系を徹底解説 — MTokあたり0.75/0.75/4.50、自動キャッシュ10%、Batch API 50%オフ、Crazyrouterによる節約術。 tag: Pricing language: en cover_image_url: https://raw.githubusercontent.com/xujfcn/images/main/blog/covers/claude-sonnet-4-6-pricing.jpg meta_title: GPT-5-mini料金2026 — 予算に優しいAIモデル、キャッシュ&Crazyrouter meta_description: GPT-5-miniの料金ガイド。入力はMTokあたりわずか$0.75。自動キャッシュ、Batch API 50%オフ — さらにCrazyrouter割引も。 meta_keywords: GPT-5-mini pricing, cheap AI API, OpenAI budget model, Crazyrouter discount#

GPT-5-miniの料金体系を解説 — キャッシュとバッチ割引で超低コストAIを実現#

OpenAIのGPT-5ファミリーは、あらゆるユースケースと予算に対応するラインナップで登場しました。価格表の最下位に位置しながらも、その能力は決して最下位ではないのがGPT-5-miniです。GPT-5世代で最も安価なモデルでありながら、その価格帯をはるかに超える性能を発揮します。

大量のパイプラインを実行したり、チャットボットを構築したり、大規模なコンテンツモデレーションを行ったりする場合でも、GPT-5-miniはAPI料金が手に負えなくなるのを心配することなく、それらを実現できるモデルです。100万入力トークンあたりわずか0.75100万出力トークンあたり0.75**、**100万出力トークンあたり4.50で、上位モデルの数分の1のコストでGPT-5レベルの推論を提供します。

このガイドでは、GPT-5-miniの料金体系のあらゆる側面を掘り下げていきます。基本料金、自動キャッシュ、Batch API割引、そしてCrazyrouterがどのようにコストをさらに削減できるかについてです。また、実際のコストシナリオも見ていき、1トークンも使用する前にワークロードの正確なコストを見積もれるようにします。

基本料金#

GPT-5-miniは、単一の料金ティアでシンプルさを保っています。「長文コンテキスト」の個別料金はなく、コンテキストの長さに応じて料金が変わることはありません。

コンポーネント100万トークンあたりの料金
入力$0.75
キャッシュ済み入力$0.075
出力$4.50

これだけです。隠れたティアや、長いプロンプトに対する予期せぬ乗数はありません。1回のリクエストで1,000トークンを送ろうと100,000トークンを送ろうと、トークンあたりの料金は変わりません。

参考までに、GPT-5-miniが他のGPT-5ファミリーとどのように比較されるかを示します。

モデル入力 (MTokあたり)出力 (MTokあたり)
GPT-5-nano$0.30$1.20
GPT-5-mini$0.75$4.50
GPT-5.4$2.50$10.00

GPT-5-miniは、まさに最適な位置にあります。実際の推論を必要とするタスクではGPT-5-nanoよりもはるかに高性能でありながら、GPT-5.4の数分の1のコストです。ほとんどのプロダクションワークロードにおいて、これがデフォルトの選択肢となります。

自動キャッシュ — 繰り返し入力が90%オフ#

OpenAI APIの最も強力なコスト削減機能の1つは自動プロンプトキャッシュであり、GPT-5-miniはこれを完全にサポートしています。同じプレフィックス(システムプロンプト、few-shotの例、またはメッセージの冒頭にある繰り返しのコンテンツ)を共有するリクエストを送信すると、OpenAIはそのプレフィックスを自動的にキャッシュし、キャッシュされた部分に対しては**標準入力価格のわずか10%**しか請求しません。

これは、キャッシュされた入力トークンが100万トークンあたりわずか$0.075であることを意味します。基本料金と比較すると、実質的に無料です。

仕組み#

キャッシュは自動です。有効にしたり、設定したり、API呼び出しを変更したりする必要はありません。OpenAIは、プロンプトの冒頭が最近送信されたリクエストと一致する場合を検出し、キャッシュされた料金を自動的に適用します。

キャッシュの対象となるのは以下の通りです。

  • システムプロンプト — アプリ内のすべてのリクエストで同じシステムプロンプトを使用する場合、最初の1回のリクエスト後にそのブロック全体がキャッシュされます。
  • Few-shotの例 — プロンプトの冒頭にある静的な例は、キャッシュの最適な候補です。
  • 共有コンテキスト — 短い時間枠内で複数のリクエストにわたって繰り返されるプレフィックス。

計算例#

典型的なリクエストが次のようであると仮定しましょう。

  • システムプロンプト + few-shotの例: 2,000トークン(最初の1回のリクエスト後にキャッシュ)
  • ユーザー固有のコンテンツ: 500トークン(キャッシュされない)
  • 出力: 300トークン

キャッシュなしの場合:

  • 入力: 2,500トークン × 0.75/MTok=0.75/MTok = 0.001875
  • 出力: 300トークン × 4.50/MTok=4.50/MTok = 0.00135
  • 1リクエストあたりの合計: $0.003225

キャッシュありの場合(最初の1回のリクエスト後):

  • キャッシュ済み入力: 2,000トークン × 0.075/MTok=0.075/MTok = 0.00015
  • 新規入力: 500トークン × 0.75/MTok=0.75/MTok = 0.000375
  • 出力: 300トークン × 4.50/MTok=4.50/MTok = 0.00135
  • 1リクエストあたりの合計: $0.001875

これは1リクエストあたりのコストを42%削減するものであり、自動的に行われます。プロンプトのキャッシュ可能な部分が多いほど、節約額は大きくなります。

キャッシュ + Batch API: 究極の組み合わせ#

ここからが本当に面白いところです。キャッシュはBatch API割引(次に説明します)と組み合わせることができます。繰り返し使用されるシステムプロンプトでバッチジョブを実行している場合、キャッシュされた入力トークンは100万トークンあたり$0.0375となり、基本入力料金から95%オフになります。

Batch API — すべてが50%オフ#

OpenAIのBatch APIは、リアルタイム応答を必要としないワークロード向けに設計されています。リクエストのバッチを送信すると、OpenAIは24時間以内にそれらを処理します。この柔軟性と引き換えに、入力トークンと出力トークンの両方で一律50%の割引が適用されます。

コンポーネント標準料金Batch API料金
入力$0.75/MTok$0.375/MTok
キャッシュ済み入力$0.075/MTok$0.0375/MTok
出力$4.50/MTok$2.25/MTok

Batch APIは以下に最適です。

  • データ分類 — 数千件のレコードを一晩でラベリング。
  • コンテンツ生成 — 商品説明、要約、翻訳を一括生成。
  • 評価パイプライン — モデルの出力を採点したり、大規模なデータセットで品質チェックを実行したりする。
  • コンテンツモデレーション — フラグが立てられたコンテンツを1つずつではなく、バッチで処理する。

バッチとリアルタイムの使い分け#

レイテンシが問題にならない場合はBatch APIを使用してください。ユーザーが応答を待っている場合は、標準APIを使用します。数分または数時間待つことができるアイテムのキューを処理している場合は、バッチ処理して50%節約しましょう。

Crazyrouterの料金 — さらに安価に#

Crazyrouterは、GPT-5-miniを**OpenAIの公式料金の55%**で提供しています。これは、すでに低い基本料金に加えて、すべてのトークンで45%の割引が適用されることを意味します。

コンポーネントOpenAI公式Crazyrouter料金節約額
入力$0.75/MTok$0.4125/MTok45%オフ
出力$4.50/MTok$2.475/MTok45%オフ

APIはOpenAIのSDKと完全に互換性があります。base_urlを変更し、CrazyrouterのAPIキーを使用するだけです。その他はすべて同じです。同じリクエスト形式、同じレスポンス形式、同じモデル名です。

コード例: OpenAI Python SDK#

python
from openai import OpenAI

client = OpenAI(
    api_key="your-crazyrouter-api-key",
    base_url="https://crazyrouter.com/v1"
)

response = client.chat.completions.create(
    model="gpt-5-mini",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Explain quantum computing in simple terms."}
    ]
)

print(response.choices[0].message.content)

コード例: cURL#

bash
curl https://crazyrouter.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer your-crazyrouter-api-key" \
  -d '{
    "model": "gpt-5-mini",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "Explain quantum computing in simple terms."}
    ]
  }'

これだけです。2行の変更(base_urlapi_key)で、すべてのリクエストで45%節約できます。SDKの変更も、移行の煩わしさもありません。

実世界のコスト比較#

これらの数値を、3つの大量生産シナリオで具体的に見ていきましょう。

シナリオ1: 分類パイプライン#

1日あたり100,000件のカスタマーサポートチケットを分類しています。各チケットは平均200入力トークンで、50トークンの分類出力があります。キャッシュされる1,500トークンのシステムプロンプトを使用します。

1日のトークン使用量:

  • キャッシュ済み入力: 1,500 × 100,000 = 150Mトークン
  • 新規入力: 200 × 100,000 = 20Mトークン
  • 出力: 50 × 100,000 = 5Mトークン
プロバイダーキャッシュ済み入力新規入力出力1日あたりの合計月額 (30日)
OpenAI標準$11.25$15.00$22.50$48.75$1,462.50
OpenAI Batch$5.63$7.50$11.25$24.38$731.25
Crazyrouter$6.19$8.25$12.38$26.81$804.38

Batch APIを使用すれば、1日10万件のチケットを25ドル以下で処理できます。CrazyrouterのリアルタイムAPIを使用すれば、OpenAIのバッチ料金とほぼ同じコストで即座の応答が得られます。

シナリオ2: 顧客向けチャットボット#

あなたのチャットボットは1日あたり50,000件の会話を処理します。平均的な会話は、800入力トークン(500トークンのキャッシュされるシステムプロンプトを含む)と400出力トークンです。

1日のトークン使用量:

  • キャッシュ済み入力: 500 × 50,000 = 25Mトークン
  • 新規入力: 300 × 50,000 = 15Mトークン
  • 出力: 400 × 50,000 = 20Mトークン
プロバイダーキャッシュ済み入力新規入力出力1日あたりの合計月額 (30日)
OpenAI標準$1.88$11.25$90.00$103.13$3,093.75
Crazyrouter$1.03$6.19$49.50$56.72$1,701.56

Crazyrouterは、このチャットボットのワークロードで月額$1,392を節約します。チャットボットはリアルタイム応答を必要とするため、ここではBatch APIは適用されないことに注意してください。

シナリオ3: 大規模なコンテンツモデレーション#

1日あたり500,000件のユーザー生成投稿をモデレートしています。各投稿は平均150入力トークンで、30トークンのモデレーション判定があります。システムプロンプトは1,000トークン(キャッシュ済み)です。

1日のトークン使用量:

  • キャッシュ済み入力: 1,000 × 500,000 = 500Mトークン
  • 新規入力: 150 × 500,000 = 75Mトークン
  • 出力: 30 × 500,000 = 15Mトークン
プロバイダーキャッシュ済み入力新規入力出力1日あたりの合計月額 (30日)
OpenAI標準$37.50$56.25$67.50$161.25$4,837.50
OpenAI Batch$18.75$28.13$33.75$80.63$2,418.75
Crazyrouter$20.63$30.94$37.13$88.69$2,660.63

1日あたり50万件の投稿を処理する場合、レイテンシを許容できるのであればBatch APIが圧倒的に有利です。リアルタイムモデレーションの場合、Crazyrouterはバッチ料金に近い価格で即座の結果を提供します。

GPT-5-mini vs GPT-5-nano vs GPT-5.4: どれを使うべきか?#

GPT-5ファミリーには3つの異なるティアがあります。それぞれの考え方は以下の通りです。

GPT-5-nano (0.30/0.30/1.20 per MTok)#

超軽量オプションです。GPT-5-nanoは、深さよりも速度とコストが重要となる最もシンプルなタスク向けに作られています。基本的な分類、エンティティ抽出、簡単な再フォーマット、または適切なモデルへのクエリルーティングなどを考えてみてください。高速で非常に安価ですが、微妙な推論や複雑な指示にはうまく対応できません。

最適な用途: 大量で低複雑度のタスク。ルーターまたは事前フィルターとして使用します。

GPT-5-mini (0.75/0.75/4.50 per MTok)#

主力モデルです。GPT-5-miniは、堅実な推論、優れた指示追従性、信頼性の高い出力品質で、プロダクションタスクの大部分を処理します。ほとんどのチームがここから始めるべきモデルです。実際の作業に十分な能力があり、大規模な運用にも十分安価です。

最適な用途: チャットボット、分類、要約、コンテンツ生成、コードアシスタンス、およびほとんどのプロダクションワークロード。

GPT-5.4 (2.50/2.50/10.00 per MTok)#

強力なモデルです。GPT-5.4は、品質が譲れないタスク向けです。複雑な分析、本当に優れたクリエイティブライティング、多段階の推論、または誤った回答が高価になるようなあらゆるタスクです。GPT-5-miniよりも3〜4倍のコストがかかるため、選択的に使用してください。

最適な用途: 複雑な推論、高リスクな意思決定、プレミアムなユーザー向け体験、およびGPT-5-miniの出力品質では不十分なタスク。

スマートなアプローチ: 階層型ルーティング#

多くのプロダクションシステムでは、これら3つのモデルを組み合わせて使用します。

  1. GPT-5-nanoは受信リクエストをルーティングし、些細なタスクを処理します。
  2. GPT-5-miniは標準的なワークロードの大部分を処理します。
  3. GPT-5.4は複雑または高価値なリクエストに対応します。

このアプローチにより、平均コストをGPT-5-miniの料金に近づけつつ、重要な部分ではGPT-5.4の品質を提供できます。

主なポイント#

  • GPT-5-miniは入力0.75/MTok、出力0.75/MTok、出力4.50/MTok — GPT-5ファミリーで最も安価で有能なモデルです。
  • 自動キャッシュにより、システムプロンプトやfew-shotの例のような繰り返しプレフィックスの入力コストを90%削減します。設定は不要です。
  • Batch APIは、最大24時間のレイテンシを許容できるワークロードの場合、入力と出力の両方で50%節約できます。
  • キャッシュ + バッチの組み合わせ — バッチモードでのキャッシュ済み入力はわずか$0.0375/MTokで、基本料金から95%割引です。
  • CrazyrouterはGPT-5-miniを公式料金の55%で提供 — 移行作業なしで45%節約できます。base_urlを交換するだけです。
  • 単一ティア料金なので、予期せぬ料金は発生しません。コンテキストの長さに応じて料金が変わることはありません。
  • ほとんどのプロダクションワークロードでは、GPT-5-miniがデフォルトの選択肢です。簡単なルーティングにはGPT-5-nanoを、複雑な推論にはGPT-5.4を使用します。

CrazyrouterでGPT-5-miniを始める#

GPT-5-miniを45%オフで実行する準備はできましたか?Crazyrouterは、OpenAI APIとの完全な互換性を、より低価格で、レート制限の心配なく、移行作業なしで提供します。

  1. crazyrouter.comサインアップ
  2. ダッシュボードからAPIキーを取得
  3. base_urlhttps://crazyrouter.com/v1変更
  4. すべてのリクエストで節約を開始

契約なし、最低利用額なし。使った分だけ支払う従量課金制です。

👉 今すぐCrazyrouterを試す →


最終更新日: 2026年4月27日

免責事項: 料金情報は、公開日時点でのOpenAIの公開データに基づいています。料金は変更される場合があります。Crazyrouterの料金は現在のレートに基づいており、調整される可能性があります。購入を決定する前に、必ず公式のOpenAI料金ページおよびCrazyrouterで現在の料金を確認してください。コストシナリオにおけるトークン数は推定値であり、実際の使用量は特定の実装によって異なる場合があります。

Related Articles