
Gemini 3.1 Proの料金体系を解説 — コンテキスト階層、キャッシュ、Crazyrouterで節約する方法
title: "Gemini 3.1 Proの料金体系を解説 — コンテキスト階層、キャッシュ、Crazyrouterで節約する方法" slug: gemini-3-1-pro-pricing summary: "Gemini 3.1 Pro Preview APIの料金体系を徹底解説 — 200K以下のコンテキストでMTokあたり12、200K超で18、コンテキストキャッシュ、Crazyrouterによる節約術。" tag: Pricing language: ja cover_image_url: "https://raw.githubusercontent.com/xujfcn/images/main/blog/covers/claude-sonnet-4-6-pricing.jpg" meta_title: "Gemini 3.1 Pro 料金体系 2026 — コンテキスト階層、キャッシュ、Crazyrouter" meta_description: "Gemini 3.1 Proの完全な料金ガイド。コンテキスト階層型料金、MTokあたり$0.20のキャッシュ、1Mのコンテキストウィンドウ — さらにCrazyrouter割引。" meta_keywords: "Gemini 3.1 Pro pricing, Google AI API cost, Gemini API, context caching, Crazyrouter discount" date: "2026-04-27"#
Gemini 3.1 Proの料金体系を解説 — コンテキスト階層、キャッシュ、Crazyrouterで節約する方法#
GoogleのGemini 3.1 Pro Previewは、現在利用可能な大規模言語モデルの中でも最も高性能なものの一つであり、100万トークンという巨大なコンテキストウィンドウ、マルチモーダル入力サポート、そして強力な推論性能を提供します。しかし、その優れた能力に伴い、すべての開発者やチームが最初に尋ねる疑問があります。それは「実際にはいくらかかるのか?」というものです。
多くの競合モデルが固定のトークン単価を請求するのとは異なり、Gemini 3.1 Proはコンテキスト階層型料金体系を導入しています。これは、1Mのコンテキストウィンドウをどれだけ使用するかによって、トークンあたりのコストが変化することを意味します。これはAPI料金の仕組みにおける重要な変化であり、これを理解することで、毎月数千ドルもの節約が可能になります。
このガイドでは、Gemini 3.1 Pro Previewの料金に関するあらゆる側面を掘り下げます。基本料金、コンテキスト階層、キャッシュ割引、無料枠、グラウンディング費用、そしてCrazyrouterを通じて10%割引でアクセスする方法について説明します。また、実際のコストシナリオを検討し、GPT-5.4やClaude Sonnet 4.6との料金比較も行います。
それでは、詳しく見ていきましょう。
基本料金: コンテキスト階層型入力と出力#
Gemini 3.1 Proの料金モデルを特徴づけるのは、その2段階のコンテキスト構造です。Googleは、プロンプト(入力)の合計が200Kトークン以内か、それ以上かによって料金を分けています。
階層1: プロンプトが200Kトークン以下の場合#
| コンポーネント | 100万トークン(MTok)あたりの価格 |
|---|---|
| 入力 | $2.00 |
| 出力 | $12.00 |
階層2: プロンプトが200Kトークンを超える場合#
| コンポーネント | 100万トークン(MTok)あたりの価格 |
|---|---|
| 入力 | $4.00 |
| 出力 | $18.00 |
音声入力#
| コンポーネント | 100万トークン(MTok)あたりの価格 |
|---|---|
| 音声 | $1.00 |
階層の境界線は200,000入力コンテキストトークンです。プロンプトがこのしきい値を超えると、入力と出力の両方の料金が跳ね上がります。入力はMTokあたり4に倍増し、出力はMTokあたり18に50%増加します。
これは、1MのコンテキストウィンドウがGemini 3.1 Proの主要な機能の一つであるため重要です。コードベース全体、長文のドキュメント、または拡張された会話履歴を処理するために使用する場合、定期的に200Kの境界を超える可能性があります。この階層を考慮したプロンプトのアーキテクチャを計画することで、大幅な節約につながります。
ほとんどの標準的なAPIユースケース(チャットボット、要約、適度なコンテキストでのコード生成など)では、200K以下の階層に快適に収まるでしょう。上位階層は、法律文書分析、リポジトリ全体のコードレビュー、複数文書の研究統合など、真に深いコンテキストを必要とするパワーユーザー向けに設計されています。
音声入力はコンテキストの長さにDかかわらずMTokあたり$1.00で別途課金されるため、Gemini 3.1 Proは音声およびオーディオ処理のワークロードにとって競争力のある選択肢となります。
コンテキストキャッシュ: 真のコスト削減策#
コンテキストキャッシュは、Gemini 3.1 Proの料金が真に興味深いものとなる点です。同じ大規模なコンテキスト(システムプロンプト、参照ドキュメント、コードベースなど)を繰り返し送信する場合、それをキャッシュして、その後のリクエストで劇的に少ない費用で利用できます。
キャッシュ料金#
| キャッシュ階層 | 100万トークン(MTok)あたりの価格 |
|---|---|
| 200K以下のコンテキスト | $0.20 |
| 200Kを超えるコンテキスト | $0.40 |
| キャッシュストレージ | MTokあたり1時間あたり$4.50 |
キャッシュされた入力トークンは、200K階層内のプロンプトの場合、わずかMTokあたり2.00と比較して90%の割引**です。200Kを超える階層の場合、キャッシュされたトークンはMTokあたり4.00から90%の削減となります。
トレードオフは、MTokあたり1時間あたり$4.50のストレージ費用です。これは、短時間内に同じコンテキストに対して頻繁にリクエストを行う場合に、キャッシュが最も費用対効果が高いことを意味します。
キャッシュが有効なケース#
コンテキストキャッシュは、以下の用途に最適です。
- 大規模なシステムプロンプトを持つチャットボット: システムプロンプトが50Kトークンで、1時間に数百の会話を処理する場合、そのプロンプトをキャッシュすることで大幅な節約になります。
- ドキュメントQ&Aシステム: ドキュメントを一度アップロードしてキャッシュし、それに対して複数のクエリを実行します。
- コードアシスタント: リポジトリのコードベースをキャッシュし、ユーザーがセッション中にそれについて質問できるようにします。
- バッチ処理: 共有コンテキストを持つ多くの入力に対して同じ分析を実行する場合。
キャッシュが有効でないケース#
繰り返されるコンテキストがなく、ユニークなワンオフプロンプトを送信している場合、キャッシュはメリットなしにストレージ費用を追加するだけです。損益分岐点はリクエストの頻度によって異なります。一般的に、同じコンテキストを1時間に数回以上再利用する場合は、キャッシュが費用を回収できます。
簡単な計算: キャッシュのROI#
100Kトークンのコンテキストがあり、1時間に50回クエリを実行するとします。
キャッシュなしの場合:
- 50リクエスト × 100K入力トークン = 5M入力トークン
- コスト: 5 × 10.00
キャッシュありの場合:
- 1回の未キャッシュリクエスト: 100Kトークン × 0.20
- 49回のキャッシュ済みリクエスト: 4.9Mトークン × 0.98
- ストレージ: 0.1 MTok × 0.45
- 合計: $1.63
このシナリオでは、84%の節約になります。キャッシュされたコンテキストに対してリクエストを多く行えば行うほど、経済性は向上します。
無料枠: 支払う前に試す#
GoogleはGemini 3.1 Pro Previewの無料枠を提供しており、プロトタイピングや軽度の開発には十分な寛大さです。
- レート制限: 有料ティアよりも低い(特定のRPM/TPM制限が適用されます)
- アクセス: Google AI StudioおよびGemini APIを通じて利用可能
- 制限: 無料枠のリクエストはモデル改善のために使用される場合があります。本番環境や機密データには推奨されません。
無料枠では、Gemini 3.1 Proの機能(推論、コード生成、マルチモーダル理解、そしてその巨大なコンテキストウィンドウ)を、予算を投入することなくテストできます。これは、スケールアップする前に、特定のユースケースに対してモデルをベンチマークする確実な方法です。
本番ワークロードの場合、より高いレート制限、データプライバシー保証、SLAカバレッジのために有料ティアに移行することをお勧めします。
Google検索によるグラウンディング#
Gemini 3.1 ProはGoogle検索によるグラウンディングをサポートしており、モデルがリアルタイムのウェブ情報を取り込み、事実の正確性を向上させ、最新の応答を提供できるようにします。
グラウンディング料金#
| コンポーネント | 価格 |
|---|---|
| グラウンディングリクエスト | 1,000リクエストあたり$35.00 |
| 無料の1日あたりの許容量 | 1日あたり1,500リクエスト(RPD) |
グラウンディングリクエスト1回あたり$0.035という料金は、大規模に使用する場合、意味のあるコスト層を追加します。ただし、1日あたり1,500回の無料リクエストは、適度な使用量に対して十分なバッファを提供します。
グラウンディングは特に以下の用途で価値があります。
- ニュースと時事問題: モデルのトレーニングデータに含まれない最近の動向に関するクエリ
- ファクトチェック: ライブのウェブソースに対して主張を検証する
- リサーチアシスタント: 最新の論文、記事、データポイントを取り込む
アプリケーションがリアルタイム情報を必要としない場合、グラウンディングを完全にスキップしてこのコストを回避できます。必要なアプリケーションの場合、トークンコストに加えて、グラウンディングクエリ1,000回あたり約$35を見積もってください。
CrazyrouterでGemini 3.1 Proを10%オフで利用#
Crazyrouterは、Gemini 3.1 Pro Previewへのアクセスを**Googleの公式料金の90%**で提供します。これは、すべてのトークンコストに対して一律10%の割引です。
CrazyrouterのGemini 3.1 Pro料金#
| コンポーネント | Google公式 | Crazyrouter (10%オフ) |
|---|---|---|
| 入力 ≤200K | $2.00/MTok | $1.80/MTok |
| 出力 ≤200K | $12.00/MTok | $10.80/MTok |
| 入力 >200K | $4.00/MTok | $3.60/MTok |
| 出力 >200K | $18.00/MTok | $16.20/MTok |
統合はシームレスです。CrazyrouterはOpenAI互換のAPI形式を使用しているため、コードの2行を変更するだけで切り替えることができます。
Python (OpenAI SDK)#
from openai import OpenAI
client = OpenAI(
api_key="your-crazyrouter-api-key",
base_url="https://crazyrouter.com/v1"
)
response = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Explain context-tiered pricing in AI APIs."}
],
max_tokens=2048
)
print(response.choices[0].message.content)
cURL#
curl https://crazyrouter.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer your-crazyrouter-api-key" \
-d '{
"model": "gemini-3.1-pro-preview",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Explain context-tiered pricing in AI APIs."}
],
"max_tokens": 2048
}'
SDKの変更も、新しいライブラリも、移行の煩わしさもありません。アプリがすでにOpenAI SDK形式を使用している場合、Gemini 3.1 Proのすべてのリクエストで10%の割引を受けるまであと2行です。
実際のコストシナリオ#
これらの数値を3つの実用的なシナリオで見てみましょう。
シナリオ1: カスタマーサポートチャットボット#
設定: 10Kトークンのシステムプロンプト、平均2Kトークンのユーザーメッセージ、1Kトークンの応答、1日あたり5,000件の会話。
月間トークン使用量:
- 入力: (10K + 2K) × 5,000 × 30 = 1.8Bトークン = 1,800 MTok
- 出力: 1K × 5,000 × 30 = 150Mトークン = 150 MTok
Google直販:
- 入力: 1,800 × 3,600
- 出力: 150 × 1,800
- 合計: 月額$5,400
Crazyrouter (10%オフ):
- 入力: 1,800 × 3,240
- 出力: 150 × 1,620
- **合計: 月額540の節約)
システムプロンプトにコンテキストキャッシュを使用すると、入力コストはさらに下がります。150Kの毎日のリクエスト全体でキャッシュされた10Kのシステムプロンプトは、毎回再送信するよりもわずかな費用で済みます。
シナリオ2: 法律文書アナライザー (長文コンテキスト)#
設定: 500Kトークンの法律文書(200K超の階層)、5Kトークンのクエリ、10Kトークンの分析出力、1日あたり200件の分析。
月間トークン使用量:
- 入力: 505K × 200 × 30 = 3.03Bトークン = 3,030 MTok (200K超の階層)
- 出力: 10K × 200 × 30 = 60Mトークン = 60 MTok
Google直販:
- 入力: 3,030 × 12,120
- 出力: 60 × 1,080
- 合計: 月額$13,200
Crazyrouter (10%オフ):
- 入力: 3,030 × 10,908
- 出力: 60 × 972
- **合計: 月額1,320の節約)
このシナリオは、コンテキスト階層が重要である理由を浮き彫りにします。文書あたり500Kトークンでは、200Kを超える料金階層にしっかりと入っています。セッション内で繰り返されるクエリのために文書をキャッシュすると、ここでのコストは劇的に削減されます。
シナリオ3: コードコンテキストを持つ開発者ツール#
設定: 80Kトークンのコードベースコンテキスト(キャッシュ済み)、3Kトークンのクエリ、2Kトークンの応答、1日あたり1,000件のリクエスト。
月間トークン使用量:
- キャッシュ済み入力: 80K × 1,000 × 30 = 2.4Bトークン = 2,400 MTok
- 新規入力: 3K × 1,000 × 30 = 90Mトークン = 90 MTok
- 出力: 2K × 1,000 × 30 = 60Mトークン = 60 MTok
Google直販 (キャッシュあり):
- キャッシュ済み入力: 2,400 × 480
- 新規入力: 90 × 180
- 出力: 60 × 720
- キャッシュストレージ: 0.08 MTok × 259.20
- 合計: 約月額$1,639
Crazyrouter (トークンコスト10%オフ):
- キャッシュ済み入力: 2,400 × 432
- 新規入力: 90 × 162
- 出力: 60 × 648
- キャッシュストレージ: 約$259.20
- **合計: 約月額138の節約)
キャッシュが大きな役割を果たしている場合でも、Crazyrouterの10%割引は時間の経過とともに積み重なります。
Gemini 3.1 Pro vs GPT-5.4 vs Claude Sonnet 4.6#
Gemini 3.1 Proは、他の主要モデルと比較して価格面でどうでしょうか?
| モデル | 入力価格 (MTok) | 出力価格 (MTok) | コンテキストウィンドウ | 備考 |
|---|---|---|---|---|
| Gemini 3.1 Pro (≤200K) | $2.00 | $12.00 | 1M tokens | 階層型料金、キャッシュ利用可能 |
| Gemini 3.1 Pro (>200K) | $4.00 | $18.00 | 1M tokens | ディープコンテキスト向けの上位階層 |
| GPT-5.4 | $2.50 | $10.00 | 256K tokens | 固定料金、コンテキスト階層なし |
| Claude Sonnet 4.6 | $3.00 | $15.00 | 200K tokens | 拡張推論利用可能 |
主要な比較#
Gemini 3.1 Pro vs GPT-5.4: Geminiは入力コスト(MTokあたり2.50)で優位に立ちますが、出力コスト(10.00)では劣ります。ワークロードが入力中心(大規模なコンテキスト、短い応答)の場合、Geminiの方が安価です。長い出力を生成する場合、GPT-5.4が有利です。Geminiの1MコンテキストウィンドウはGPT-5.4の256Kよりも4倍大きく、長文ドキュメントのワークロードにとって決定的な利点となります。
Gemini 3.1 Pro vs Claude Sonnet 4.6: Geminiは、200K以下の階層内で、入力(3.00)と出力(15.00)の両方で安価です。Claude Sonnet 4.6は、複雑な推論タスクに対してプレミアムを正当化する拡張推論機能を提供しますが、純粋なトークンあたりの価格では、Gemini 3.1 Proの方が経済的な選択肢です。
コンテキストウィンドウの要素: Geminiの1Mトークンコンテキストは比類がありません。ユースケースが200K〜256Kトークンを超える文書の処理を必要とする場合、これら3つのモデルの中でGemini 3.1 Proが実質的に唯一の選択肢となります。そして、200Kを超える階層の料金(18.00)であっても、競合他社では単に不可能なワークロードを可能にします。
キャッシュの利点: GeminiのMTokあたり$0.20のコンテキストキャッシュは、GPT-5.4やClaude Sonnet 4.6の標準料金には直接的な同等物がありません。繰り返しコンテキストを使用するワークロードの場合、これによりGemini 3.1 Proは、見出しの料金よりも劇的に安価になる可能性があります。
主なポイント#
-
コンテキスト階層が重要: 可能な限り200K入力トークン以下に抑えることで、18.00ではなく12.00の料金を利用できます。それに応じてプロンプトを設計してください。
-
キャッシュは画期的な機能: MTokあたり4.50)があるため、戦略的にキャッシュする必要があります。高頻度で短時間のセッションが最も恩恵を受けます。
-
1Mコンテキストウィンドウはユニーク: 他の主要モデルはこれほど多くのコンテキストを提供していません。それが必要な場合、Gemini 3.1 Proが明確な選択肢です。そして、階層型料金により、深いコンテキストを実際に使用する場合にのみプレミアムを支払うことになります。
-
プロトタイピング用の無料枠: 予算を投入する前にすべてをテストしてください。Googleの無料枠は、意味のある評価を行うのに十分な寛大さです。
-
グラウンディングは費用がかさむ: 1,000リクエストあたり$35のグラウンディングは強力ですが、安価ではありません。1日あたり1,500回の無料リクエストを賢く利用し、リアルタイム情報が本当にアウトプット品質を向上させる場合にのみグラウンディングを有効にしてください。
-
Crazyrouterで10%節約: 統合の摩擦なしに一律10%割引。Gemini APIコールに月額500以上の節約になります。
Gemini 3.1 Proで開発を始めましょう#
Gemini 3.1 Pro Previewは、スマートなアーキテクチャに報いる料金体系で、最先端のパフォーマンスを提供します。コンテキスト階層型モデルと積極的なキャッシュ割引を組み合わせることで、料金体系を理解している開発者は、驚くほどリーズナブルなコストで強力なアプリケーションを構築できます。
始める準備はできましたか?Crazyrouterにサインアップして、Gemini 3.1 Proを公式料金の10%オフで利用しましょう。契約も最低利用額も不要で、すべてのAPIコールでより良い料金が適用されます。既存のOpenAI SDKコードはそのまま動作します。base_urlを変更するだけで、すぐに利用できます。
最終更新日: 2026年4月27日
免責事項: 料金情報は、公開日時点でのGoogleの公開データに基づいています。価格は予告なく変更される場合があります。Crazyrouterの割引率は、Crazyrouterの現在の利用規約および料金ポリシーに従います。購入を決定する前に、必ずGoogle AIおよびCrazyrouterの公式ウェブサイトで現在の料金を確認してください。この記事は情報提供のみを目的としており、財務上のアドバイスを構成するものではありません。


