
GPT-5.5 料金ガイド — OpenAI最新フラッグシップモデル、推論トークン、Crazyrouterで最大45%節約
GPT-5.5 料金ガイド — OpenAI最新フラッグシップモデル、推論トークン、Crazyrouterで最大45%節約#
OpenAIがGPT-5.5をリリースしました。最新のフラッグシップモデルであり、大きな進化を遂げています。2026年4月にリリースされたGPT-5.5は、プレミアムなGPT-5.4とコスト効率の高いGPT-5の中間に位置し、100万トークンのコンテキストウィンドウ、組み込みの推論機能、そして本番ワークロードに魅力的な競争力のある価格設定を提供します。
AI搭載アプリケーションの構築、大規模データ処理の実行、あるいは予算に合ったOpenAIモデルの選定など、どのような用途であっても、このガイドではGPT-5.5 APIの料金について知っておくべきすべてを解説します。Crazyrouterを利用して最大45%コストを削減する方法も含めてご紹介します。
GPT-5.5 基本料金#
OpenAI APIを通じたGPT-5.5の料金は以下の通りです:
| 項目 | 100万トークンあたりの価格 |
|---|---|
| 入力トークン | $2.00 |
| キャッシュ済み入力トークン | $0.50(75%割引) |
| 出力トークン | $8.00 |
| 推論トークン | $8.00(出力トークンと同じレート) |
主な仕様:
- コンテキストウィンドウ: 1,000,000トークン(1M)
- 最大出力トークン: 100,000トークン(100K)
- 学習データのカットオフ: 2026年3月
- 推論レベル: low、medium、high
前モデルのGPT-5.4(入力/出力:10.00)と比較すると、GPT-5.5は入力・出力ともに20%の値下げを実現しつつ、より大きなコンテキストウィンドウと改善された推論性能を備えています。これは小さなアップグレードではなく、日々数百万トークンを処理するチームにとって大きなコスト削減です。
推論トークンを理解する#
GPT-5.5は推論モデルであり、最終的な回答を生成する前に複雑な問題を「考える」ことができます。これは強力な機能ですが、料金に関して理解しておくべきポイントがあります。
推論トークンとは?#
GPT-5.5が複雑なタスク(多段階の数学、コードのデバッグ、論理分析など)に遭遇すると、可視的な出力を生成する前に内部的な推論トークンを生成します。これらの推論トークンはモデルの思考連鎖プロセスを表しています。レスポンスには表示されませんが(reasoningパラメータで要求しない限り)、課金対象にはなります。
推論トークンの課金方法#
推論トークンは出力トークンレートの100万トークンあたり$8.00で課金されます。これは重要なポイントです。なぜなら、1回のAPIコールで、レスポンスに表示されるよりもはるかに多くのトークンが生成される可能性があるからです。
例えば、GPT-5.5に複雑なコーディング問題を解かせた場合:
- 入力トークン: 500(プロンプト)
- 推論トークン: 3,000(内部的な思考)
- 出力トークン: 1,500(可視的なレスポンス)
- 課金対象の出力合計: 4,500トークン(推論 + 出力)
この場合の実際の出力コストは、表示される1,500トークンではなく、4,500トークンに基づいて計算されます。
reasoning_effortでコストを制御する#
OpenAIは、モデルの思考量を制御できるreasoning_effortパラメータを提供しています:
low— 最小限の推論。テキスト生成、要約、シンプルなQ&Aなどの単純なタスクに最適。推論トークンの使用を抑え、コストを低く保ちます。medium— バランスの取れた推論。コード生成、データ分析、構造化された抽出など、中程度の複雑さのタスクに適しています。high— 最大限の推論。複雑な数学、多段階のロジック、高度なコードデバッグ、または精度が最重要なタスクに使用します。
from openai import OpenAI
client = OpenAI()
response = client.chat.completions.create(
model="gpt-5.5",
reasoning_effort="low", # "low", "medium", or "high"
messages=[
{"role": "user", "content": "Summarize this article in 3 bullet points."}
]
)
プロのヒント: 本番ワークロードのほとんどではlowまたはmediumをデフォルトにしましょう。highは、推論の強化が実際に出力品質を向上させることを確認したタスクにのみ使用してください。多くの開発者が、推論の恩恵を受けないタスクでもhighのままにして過剰なコストを支払っています。
1Mコンテキストウィンドウの優位性#
GPT-5.5の100万トークンコンテキストウィンドウは、最大の特長の一つです。1Mトークンは概算で以下に相当します:
- 約750,000語のテキスト
- 約15冊の長編小説
- 中規模のコードベース全体
- 数百ページのドキュメント
これにより、以前は非現実的だったり、複雑なチャンキング戦略が必要だったユースケースが可能になります:
- コードベース全体の分析 — リポジトリ全体を1つのプロンプトに入力し、包括的なコードレビューやリファクタリングの提案を得られます。
- 長文ドキュメントの処理 — 法的契約書、研究論文、財務報告書を分割せずに完全な形で分析できます。
- 長時間の会話 — 非常に長いマルチターン会話でも、以前のコンテキストを失うことなく維持できます。
- 大規模な検索セットを使ったRAG — プロンプトにより多くの検索ドキュメントを含めることで、より情報に基づいた回答を得られます。
100Kの最大出力制限も非常に余裕があり、GPT-5.5は1回のAPIコールで完全なレポート、長いコードファイル、詳細な分析など、大量のレスポンスを生成できます。
自動キャッシュ:繰り返し入力が75%オフ#
OpenAIの自動キャッシュはGPT-5.5の料金を大きく変える機能であり、ユーザー側の作業は一切不要です。
仕組み#
APIにリクエストを送信すると、OpenAIが自動的に入力トークンをキャッシュします。後続のリクエストが同じプレフィックス(プロンプトの先頭部分が一致)を共有している場合、キャッシュされたトークンは**100万トークンあたりわずか2.00レートから75%の割引です。
これは自動的に行われます。特別なAPIパラメータ、キャッシュ管理、設定は不要です。OpenAIがバックグラウンドで処理します。
キャッシュが有効になるケース#
キャッシュは以下の場合に最も効果的です:
- システムプロンプト — 複数のリクエストで同じシステムプロンプトを使用する場合(ほとんどのアプリケーションがそうです)、最初のコール後にそれらのトークンがキャッシュされます。
- Few-shotの例 — プロンプト内の静的な例は自動的にキャッシュされます。
- 共有コンテキスト — リクエスト間で繰り返されるプレフィックスはすべてキャッシュの恩恵を受けます。
- マルチターン会話 — 変更されない会話履歴の以前のメッセージがキャッシュされます。
コストへの実際の影響#
2,000トークンのシステムプロンプトを持つアプリケーションが1日10,000リクエストを処理する場合を考えてみましょう:
- キャッシュなし: 2,000 × 10,000 = 20M入力トークン × 40.00/日**
- キャッシュあり: 2,000 × 10,000 = 20Mキャッシュ済みトークン × 10.00/日**
システムプロンプトの自動キャッシュだけで1日900の節約になります。節約額はボリュームに比例して増加します。
Batch API:非同期ワークロードが50%オフ#
リアルタイムのレスポンスが不要なワークロードの場合、OpenAIのBatch APIはGPT-5.5の料金に対して一律50%の割引を提供します:
| 項目 | 標準価格 | Batch API価格 |
|---|---|---|
| 入力トークン | $2.00/MTok | $1.00/MTok |
| 出力トークン | $8.00/MTok | $4.00/MTok |
Batch APIの活用シーン#
Batch APIは最大24時間の完了ウィンドウで非同期にリクエストを処理します(ほとんどのバッチはそれよりはるかに早く完了します)。以下の用途に最適です:
- 大規模なコンテンツ生成 — 商品説明、ブログの下書き、マーケティングコピーの一括生成。
- データ抽出と分類 — リアルタイムレスポンスが不要な大規模データセットの処理。
- 評価とテスト — 数千のテストケースにわたるモデル評価の実行。
- エンベディング生成 — 検索やRAGパイプライン用のドキュメントのバッチ処理。
Batch APIと自動キャッシュを組み合わせることで、さらに大きな節約が可能です。バッチモードでのキャッシュ済み入力トークンはわずか0.50のキャッシュレートのさらに50%)です。
Crazyrouterで45%節約#
ここからが注目のポイントです。CrazyrouterはGPT-5.5を**OpenAI公式価格の55%**で提供しています。つまり、品質や信頼性を一切犠牲にすることなく45%の割引です。
Crazyrouter GPT-5.5 料金#
| 項目 | OpenAI公式 | Crazyrouter | 節約額 |
|---|---|---|---|
| 入力トークン | $2.00/MTok | $1.10/MTok | 45%オフ |
| 出力トークン | $8.00/MTok | $4.40/MTok | 45%オフ |
切り替え方法#
Crazyrouterへの切り替えは約30秒で完了します。既存のOpenAI SDKセットアップでbase_urlを変更するだけです:
Python (OpenAI SDK):
from openai import OpenAI
client = OpenAI(
api_key="your-crazyrouter-api-key",
base_url="https://crazyrouter.com/v1"
)
response = client.chat.completions.create(
model="gpt-5.5",
reasoning_effort="medium",
messages=[
{"role": "user", "content": "Explain quantum computing in simple terms."}
]
)
print(response.choices[0].message.content)
cURL:
curl https://crazyrouter.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer your-crazyrouter-api-key" \
-d '{
"model": "gpt-5.5",
"reasoning_effort": "medium",
"messages": [
{"role": "user", "content": "Explain quantum computing in simple terms."}
]
}'
Node.js:
import OpenAI from "openai";
const client = new OpenAI({
apiKey: "your-crazyrouter-api-key",
baseURL: "https://crazyrouter.com/v1"
});
const response = await client.chat.completions.create({
model: "gpt-5.5",
reasoning_effort: "medium",
messages: [
{ role: "user", content: "Explain quantum computing in simple terms." }
]
});
APIはOpenAIの仕様と完全に互換性があります。リクエスト形式、レスポンス形式、ストリーミングサポートすべて同じです。既存のコードはURLを変更するだけでそのまま動作します。
コストシナリオ:実際の使用例#
GPT-5.5のコストが実際にどのようになるか、推論トークンの影響も含めて3つの現実的なシナリオで見てみましょう。
シナリオ1:カスタマーサポートチャットボット#
設定: 1,000トークンのシステムプロンプト、平均500トークンのユーザーメッセージ、800トークンのレスポンス、低い推論レベル(約200推論トークン)、1日50,000リクエスト。
| 項目 | リクエストあたりのトークン | 1日のトークン | OpenAIコスト | Crazyrouterコスト |
|---|---|---|---|---|
| 入力(キャッシュ済みシステム) | 1,000 | 50M | $25.00 | $13.75 |
| 入力(ユーザーメッセージ) | 500 | 25M | $50.00 | $27.50 |
| 推論(low) | 200 | 10M | $80.00 | $44.00 |
| 出力 | 800 | 40M | $320.00 | $176.00 |
| 1日の合計 | $475.00 | $261.25 | ||
| 月間合計 | $14,250 | $7,837 |
Crazyrouterによる月間節約額:$6,413
シナリオ2:コードレビューパイプライン(Batch API)#
設定: バッチモードでプルリクエストを分析。平均10,000トークンのコード入力、高い推論レベル(約5,000推論トークン)、2,000トークンのレビュー出力、1日500件のPR。
| 項目 | リクエストあたりのトークン | 1日のトークン | Batch APIコスト | Crazyrouterコスト |
|---|---|---|---|---|
| 入力 | 10,000 | 5M | $5.00 | $5.50 |
| 推論(high) | 5,000 | 2.5M | $10.00 | $11.00 |
| 出力 | 2,000 | 1M | $4.00 | $4.40 |
| 1日の合計 | $19.00 | $20.90 |
注:バッチワークロードの場合、OpenAIのネイティブBatch API(50%オフ)はCrazyrouterの標準価格より安くなる場合があります。レイテンシ要件に基づいて選択してください。Batch APIは非同期、Crazyrouterはリアルタイムです。
シナリオ3:大規模コンテキストでのドキュメント分析#
設定: 200,000トークンの法的文書を分析、中程度の推論レベル(約8,000推論トークン)、5,000トークンの要約出力、1日100件のドキュメント。同じドキュメントテンプレートのため約50,000トークンがキャッシュ済み。
| 項目 | リクエストあたりのトークン | 1日のトークン | OpenAIコスト | Crazyrouterコスト |
|---|---|---|---|---|
| 入力(キャッシュ済みプレフィックス) | 50,000 | 5M | $2.50 | $1.38 |
| 入力(固有コンテンツ) | 150,000 | 15M | $30.00 | $16.50 |
| 推論(medium) | 8,000 | 0.8M | $6.40 | $3.52 |
| 出力 | 5,000 | 0.5M | $4.00 | $2.20 |
| 1日の合計 | $42.90 | $23.60 | ||
| 月間合計 | $1,287 | $708 |
Crazyrouterによる月間節約額:$579
GPT-5.5 vs GPT-5.4 vs GPT-5:どのモデルを選ぶべきか?#
GPT-5.5と他のモデルの比較は以下の通りです:
| 機能 | GPT-5 | GPT-5.5 | GPT-5.4 |
|---|---|---|---|
| 入力価格 | $1.25/MTok | $2.00/MTok | $2.50/MTok |
| 出力価格 | $10.00/MTok | $8.00/MTok | $10.00/MTok |
| コンテキストウィンドウ | 256K | 1M | 256K |
| 最大出力 | 32K | 100K | 32K |
| 推論 | Basic | Advanced | Advanced |
| 最適な用途 | コスト重視のワークロード | バランスの取れた性能 | 最大限の能力 |
GPT-5.5を選ぶべきケース#
- 大規模なドキュメントやコードベースに1Mコンテキストウィンドウが必要な場合
- GPT-5.4より低い出力価格で強力な推論が必要な場合
- 長文コンテンツの生成に100K最大出力が必要な場合
- GPT-5ファミリーで最高のコストパフォーマンスを求める場合
GPT-5を選ぶべきケース#
- コストが最優先で、拡張コンテキストが不要な場合
- タスクが単純で、高度な推論が不要な場合
- 入力量が多く出力が少ない場合(GPT-5の$1.25入力レートが有利)
GPT-5.4を選ぶべきケース#
- コストに関係なく最高峰の性能が必要な場合
- 最も高度な推論能力が求められるタスクの場合
- わずかな品質向上が重要な研究や複雑な分析に取り組んでいる場合
GPT-5.5はほとんどの本番アプリケーションにとって最適なバランスを実現しています。GPT-5.4より出力が20%安く、4倍大きなコンテキストウィンドウを提供しながら、同等の推論品質を備えています。
まとめ#
-
GPT-5.5の料金は入力8.00/MTokで、GPT-5.4より両方の面で20%安くなっています。
-
推論トークンは出力レート($8.00/MTok)で課金されます。
reasoning_effortを使ってコストを制御しましょう。深い推論が必要でない限り、lowまたはmediumをデフォルトにしてください。 -
自動キャッシュにより、繰り返し入力トークンが75%節約されます。設定は不要です。キャッシュヒットを最大化するために、安定したプレフィックスでプロンプトを設計しましょう。
-
Batch APIは非同期ワークロードのコストを50%削減します。キャッシュと組み合わせることで最大限の節約が可能です。
-
CrazyrouterはGPT-5.5を公式価格の55%(4.40/MTok)で提供しています。
base_urlを変更する1行のコードで切り替えられます。 -
1Mコンテキストウィンドウと100K最大出力により、GPT-5.5は大規模ドキュメント処理、コードベース全体の分析、長文生成に特に適しています。
GPT-5.5を始めよう#
GPT-5.5で開発を始める準備はできましたか?方法は以下の通りです:
- OpenAI直接利用: platform.openai.comでサインアップし、モデル名
gpt-5.5を使用 - Crazyrouter経由(45%オフ): crazyrouter.comでサインアップし、APIキーを取得して、OpenAI SDKで
base_url="https://crazyrouter.com/v1"を設定
Crazyrouterはストリーミング、ファンクションコーリング、推論レベル制御、完全な1Mコンテキストウィンドウなど、GPT-5.5のすべての機能をサポートしています。機能の妥協なし、ただ低価格です。
最終更新:2026年4月27日
免責事項:料金情報は、公開日時点でOpenAIが公開しているデータに基づいています。料金は予告なく変更される場合があります。Crazyrouterの料金はCrazyrouterの利用規約に従います。購入を決定する前に、必ず各プロバイダーのウェブサイトで最新の料金をご確認ください。シナリオ内のトークン数は推定値であり、実際の使用量は特定の入力やモデルの動作によって異なる場合があります。


