Login
Back to Blog
Gemini 3 Flashの料金体系を解説 — Crazyrouterの割引で速度とコストを両立

Gemini 3 Flashの料金体系を解説 — Crazyrouterの割引で速度とコストを両立

C
Crazyrouter Team
April 27, 2026
0 views日本語Pricing
Share:


title: Gemini 3 Flashの料金体系を解説 — Crazyrouterの割引で速度とコストを両立 slug: gemini-3-flash-pricing summary: Gemini 3 Flash Preview APIの料金体系を徹底解説 — 0.50/0.50/3.00/MTok、コンテキストキャッシュ、無料枠、Crazyrouterの割引について。 tag: Pricing language: en cover_image_url: https://raw.githubusercontent.com/xujfcn/images/main/blog/covers/claude-sonnet-4-6-pricing.jpg meta_title: Gemini 3 Flash 料金 2026 — バランスの取れたモデル、キャッシュ、Crazyrouter meta_description: Gemini 3 Flashの料金ガイド。入力$0.50/MTok、1Mコンテキスト、キャッシュ、無料枠 — さらにCrazyrouter割引。 meta_keywords: Gemini 3 Flash pricing, Google AI API, Gemini Flash, Crazyrouter discount#

Gemini 3 Flashの料金体系を解説 — Crazyrouterの割引で速度とコストを両立#

GoogleのGemini 3 Flash Previewは、多くの開発者が待ち望んでいたスイートスポットに位置しています。重量級のProモデルよりも高速で、超低価格のLiteティアよりも賢く、本番環境のワークロードを真に手頃な価格で実現できるよう料金設定されています。入力トークンはわずか100万トークンあたり$0.50、そして寛大な100万トークンのコンテキストウィンドウ、さらに組み込みのコンテキストキャッシュを備えたGemini 3 Flashは、API予算を使い果たすことなく強力な推論を必要とするチーム向けに設計されています。

このガイドでは、Gemini 3 Flash Previewの料金体系のあらゆる側面を詳しく解説します。基本料金、キャッシュの経済性、無料枠、そしてCrazyrouterを介してルーティングすることで、請求額をさらに10%削減する方法についてです。チャットボットの構築、大規模なドキュメント処理、マルチモーダルパイプラインの実行など、Gemini 3 Flashがどれくらいの費用で利用できるかを正確に理解していただけるでしょう。

最終更新日:2026年4月27日


基本料金 — トークンあたりの支払い額#

Gemini 3 Flash Previewは、シンプルなトークンごとの料金モデルを採用しています。料金表は以下の通りです。

カテゴリ100万トークンあたりの料金
Text Input$0.50
Image Input$0.50
Video Input$0.50
Audio Input$1.00
Text Output$3.00

いくつかの点がすぐに目につきます。

テキスト、画像、ビデオの入力は同じ料金です。 $0.50/MTokで、Googleはマルチモーダル入力(音声を除く)に対してプレミアム料金を課していません。これは、アプリケーションがスクリーンショット、図、ビデオフレーム、または混合メディアドキュメントを処理する場合に大きな利点となります。モダリティに関わらず、同じ一律料金が適用されます。

音声入力は2倍のコストがかかります。 $1.00/MTokの音声入力は、専用の音声認識サービスと比較しても非常に手頃ですが、音声中心のアプリケーションを構築している場合は、2倍の乗数があることに注意する価値があります。

出力トークンは入力価格の6倍です。 $3.00/MTokの出力料金は、生成が理解よりも大幅にコストがかかるという業界のパターンを踏襲しています。これにより、プロンプトエンジニアリングと出力長の管理が重要なコスト削減の手段となります。

コンテキストウィンドウ:100万トークン。 Gemini 3 Flashは最大1Mトークンのコンテキストをサポートしており、この価格帯のモデルとしては非常に大規模です。単一のリクエストで、コードベース全体、長大な法的文書、または数時間分の会議議事録を投入できます。

実際の数値との比較#

これらの価格を具体的に見てみましょう。

  • 100万入力トークン ≈ 75万語 ≈ 長編小説約10冊分
  • 1M入力トークンの処理にかかる費用はわずか**$0.50**
  • 2,000語の応答(約2,700トークン)を生成するのにかかる費用は約**$0.008** — 1セント未満

ほとんどのアプリケーションにおいて、Gemini 3 Flashでのリクエストあたりのコストは1セント未満で測定されます。


コンテキストキャッシュ — 繰り返しコストを90%削減#

Gemini APIの最も強力なコスト削減機能の1つはコンテキストキャッシュであり、Gemini 3 Flashはこれを完全にサポートしています。アプリケーションが同じ大規模なコンテキスト(システムプロンプト、参照ドキュメント、few-shotの例など)を繰り返し送信する場合、キャッシュを使用すると、そのコンテキストに対して一度だけ支払い、大幅な割引価格で再利用できます。

キャッシュ料金#

コンポーネント料金
Cached Input Tokens$0.05 / MTok
Cache Storage$1.00 / MTok / hour

**キャッシュされた入力トークンはわずか0.05/MTok—これは標準の0.05/MTok** — これは標準の0.50/MTok入力料金と比較して90%の割引です。もし200Kトークンのシステムプロンプトをすべてのリクエストで送信している場合、キャッシュを使用すると、1回の呼び出しあたり0.10だったものが0.10だったものが0.01になります。

キャッシュストレージの経済性#

$1.00/MTok/時間のストレージコストは、キャッシュの寿命について考える必要があることを意味します。簡単な計算をしてみましょう。

  • 1時間保存された100Kキャッシュトークン = $0.10
  • その1時間で50リクエストに使用された100Kキャッシュトークン = 入力コストで2.25節約(50×100K×1MTokあたり2.25節約(50 × 100K × 1MTokあたり0.45の節約)
  • その時間の純節約額: $2.15

損益分岐点は低いです。共有コンテキストで1時間に数回以上のリクエストを行う場合、キャッシュはすぐに元が取れます。

キャッシュを使用すべき時#

コンテキストキャッシュが最も効果を発揮するのは次のような場合です。

  • システムプロンプトまたは参照ドキュメントが10Kトークンを超える場合
  • 複数のユーザーに同じ基本コンテキストを提供している場合
  • すべてのリクエストが共通のプレフィックスを共有するバッチ処理を実行している場合
  • 安定したナレッジベースを持つRAGパイプラインを使用している場合

リクエストごとに非常に動的なコンテキストを持つアプリケーションでは、キャッシュの恩恵は少なくなりますが、ほとんどの本番環境のユースケースでは、これは当然の選択肢です。


無料枠 — 費用をかける前に試す#

GoogleはGemini 3 Flash Previewの無料枠を提供しており、最もアクセスしやすいフロンティアモデルの1つとして実験できます。無料枠では、開発者は以下のことができます。

  • 支払い情報を入力することなくモデルの機能をテストする
  • 費用ゼロでプロトタイプを構築し、反復する
  • 競合モデルに対して小規模な評価を実行する

無料枠にはレート制限(有料版と比較して1分あたりのリクエスト数と1日あたりのトークン数が少ない)がありますが、開発や実験には十分すぎるほどです。これは、本番環境での費用を投じる前に、Gemini 3 Flashが品質基準を満たしているかどうかを評価する場合に特に価値があります。

プロのヒント: 無料枠を使用して、Gemini 3 Flashを現在のモデルと比較ベンチマークしてください。品質がしきい値を満たしていれば、有料枠の経済性は非常に優れています。


Crazyrouter — すべての呼び出しでさらに10%節約#

すでに本番環境でGemini 3 Flashを使用する予定がある場合、API呼び出しを**Crazyrouter経由でルーティングすると、すべてのトークンコストが自動的に10%割引**になります。

Gemini 3 FlashのCrazyrouter料金#

カテゴリ公式料金Crazyrouter料金節約額
Text/Image/Video Input$0.50/MTok$0.45/MTok10%
Audio Input$1.00/MTok$0.90/MTok10%
Output$3.00/MTok$2.70/MTok10%
Cached Input$0.05/MTok$0.045/MTok10%

割引は、キャッシュされたトークンを含むすべてのトークンタイプに均一に適用されます。大量のアプリケーションでは、これはすぐに大きな額になります。

統合 — ドロップイン互換#

CrazyrouterはOpenAI SDK形式と完全に互換性があります。カスタムクライアントライブラリは必要ありません。base_urlとAPIキーを変更するだけです。

OpenAI Python SDKを使用する場合:

python
from openai import OpenAI

client = OpenAI(
    api_key="your-crazyrouter-api-key",
    base_url="https://crazyrouter.com/v1"
)

response = client.chat.completions.create(
    model="gemini-3-flash-preview",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Explain quantum computing in simple terms."}
    ],
    max_tokens=1024
)

print(response.choices[0].message.content)

curlを使用する場合:

bash
curl https://crazyrouter.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer your-crazyrouter-api-key" \
  -d '{
    "model": "gemini-3-flash-preview",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "Explain quantum computing in simple terms."}
    ],
    "max_tokens": 1024
  }'

これだけです。2行の変更(ベースURLとAPIキー)で、すべてのリクエストで10%節約できます。Crazyrouterはルーティング、ロードバランシング、請求を透過的に処理します。


実際のコストシナリオ#

Gemini 3 Flashが本番環境で実際にどれくらいの費用がかかるかを見るために、3つの実用的なシナリオを見ていきましょう。

シナリオ1:顧客サポートチャットボット#

設定: 1日あたり10,000件の会話を処理するチャットボット。各会話は平均2,000入力トークン(システムプロンプト + ユーザーメッセージ + 履歴)と500出力トークン。

コンポーネント1日あたりのトークン数1日あたりのコスト(公式)1日あたりのコスト(Crazyrouter)
Input20M tokens$10.00$9.00
Output5M tokens$15.00$13.50
Total$25.00/day$22.50/day

月額コスト: 公式で約750Crazyrouter経由で約750、Crazyrouter経由で約675。ベースURLを変更するだけで月あたり$75の節約になります。

コンテキストキャッシュを使用した場合(すべてのリクエストで共有される1,500トークンのシステムプロンプトを想定):

  • キャッシュされた入力の節約:1日あたり15Mトークン × 0.45の節約=0.45の節約 = 6.75/日
  • ストレージコスト:24時間キャッシュされた約1.5Kトークン = ごくわずか
  • Crazyrouter経由でキャッシュを使用した場合の月額コスト:約$472

シナリオ2:ドキュメント処理パイプライン#

設定: 1日あたり500件の法的文書を処理。各文書は平均50,000入力トークン。出力は文書あたり1,000トークンの要約。

コンポーネント1日あたりのトークン数1日あたりのコスト(公式)1日あたりのコスト(Crazyrouter)
Input25M tokens$12.50$11.25
Output500K tokens$1.50$1.35
Total$14.00/day$12.60/day

月額コスト: 公式で約420Crazyrouter経由で約420、Crazyrouter経由で約378。月に15,000件の法的文書を処理するにしては、驚くほど手頃な価格です。

シナリオ3:マルチモーダルコンテンツモデレーション#

設定: コンテンツモデレーションのために1日あたり50,000枚の画像を分析。各画像は平均1,000トークン、200トークンの分類出力。

コンポーネント1日あたりのトークン数1日あたりのコスト(公式)1日あたりのコスト(Crazyrouter)
Image Input50M tokens$25.00$22.50
Output10M tokens$30.00$27.00
Total$55.00/day$49.50/day

月額コスト: 公式で約1,650Crazyrouter経由で約1,650、Crazyrouter経由で約1,485。月あたり$165の節約 — 他のインフラコストを賄うのに十分です。


Gemini 3 Flash vs. 3.1 Pro vs. 2.5 Flash — その位置づけ#

Googleのモデルラインナップの中でGemini 3 Flashがどこに位置するかを理解することは、適切なツールを選択するのに役立ちます。

Gemini 3.1 Pro — 重量級#

Gemini 3.1 ProはGoogleの最も高性能なモデルであり、複雑な推論、高度なコード生成、品質が最優先されるタスク向けに設計されています。より高い価格設定と遅い推論速度が特徴です。3.1 Proを選択するのは次のような場合です。

  • 最高の推論品質が求められる場合
  • タスクが複雑な多段階ロジックを含む場合
  • コストよりも出力品質が優先される場合
  • 研究や高リスクな分析を行っている場合

Gemini 3 Flash Preview — スイートスポット#

Gemini 3 Flashは中間的な位置を占めています。Proの価格のほんの一部で強力な推論能力を提供し、応答時間は大幅に高速です。3 Flashを選択するのは次のような場合です。

  • 品質、速度、コストのバランスが必要な場合
  • 本番環境のワークロードで低レイテンシが求められる場合
  • アプリケーションが高いリクエスト量を処理する場合
  • マルチモーダル処理がコア要件である場合

Gemini 2.5 Flash — 予算重視の選択肢#

前世代のFlashモデルは、さらに低価格で利用可能ですが、機能は削減されています。2.5 Flashを選択するのは次のような場合です。

  • 非常にコストに敏感なワークロードを実行している場合
  • タスクが比較的シンプルである場合(分類、抽出、要約など)
  • 2.5 Flashの品質で十分であることをテストで確認済みの場合
  • 最大のコスト削減が、わずかな品質向上よりも優先される場合

クイック比較#

側面2.5 Flash3 Flash Preview3.1 Pro
Input Price低い$0.50/MTok高い
Output Price低い$3.00/MTok高い
Reasoning良い強い最高
Speed速い速い中程度
Context Window1M1M1M+
Best Forシンプルなタスク本番ワークロード複雑な推論

ほとんどの本番アプリケーションにおいて、Gemini 3 Flash Previewは最適な価格性能比を実現します。3.1 Proのコストプレミアムなしで、2.5 Flashよりも大幅に優れた品質が得られます。


主なポイント#

  1. 入力は安価。 テキスト、画像、ビデオで$0.50/MTokという価格は、Gemini 3 Flashがマルチモーダル処理を事実上あらゆる予算で利用可能にします。

  2. 出力でコストがかさむ。 $3.00/MTokの出力料金は、応答の長さを制御することが最大のコスト削減手段であることを意味します。max_tokensを賢く使用しましょう。

  3. コンテキストキャッシュは画期的。 繰り返しコンテキストを送信する場合、キャッシュは入力コストを90%削減します。ほとんどのユースケースでストレージ料金はごくわずかです。

  4. 無料枠が障壁を取り除く。 一銭も使わずにテストとプロトタイプ作成ができます。本番環境に投入する前に品質を検証しましょう。

  5. Crazyrouterは全体で10%節約。 2行のコード変更(ベースURL + APIキー)で、すべてのトークンで即座に割引が適用されます。大量のアプリケーションでは、これは意味のある節約へと積み重なります。

  6. Gemini 3 Flashは本番環境の主力モデル。 最も安価なモデルでも、最も強力なモデルでもありませんが、ほとんどの実際のアプリケーションにとって最も理にかなったモデルです。


CrazyrouterでGemini 3 Flashを始めよう#

割引料金でGemini 3 Flashを使って開発を始める準備はできましたか?

  1. crazyrouter.comでサインアップし、APIキーを取得
  2. ベースURLをhttps://crazyrouter.com/v1に設定
  3. リクエストでモデルgemini-3-flash-previewを使用
  4. すべてのAPI呼び出しで10%節約を開始 — 契約なし、最低利用額なし

CrazyrouterはOpenAI互換のAPI形式を完全にサポートしているため、既存のプロバイダーから数分で切り替えることができます。すべてのGeminiモデルに加え、Claude、GPT、その他のフロンティアモデルもすべて割引料金で利用できます。

👉 CrazyrouterでGemini 3 Flashを使い始める →


免責事項:料金情報は、2026年4月27日時点の公開データに基づいています。GoogleはGemini APIの料金をいつでも更新する可能性があります。「プレビュー」モデルは、一般提供開始時に異なる料金設定になる場合があります。Crazyrouterの割引率は変更される可能性があります。購入を決定する前に、必ずGoogle AIおよびCrazyrouterの公式ウェブサイトで現在の料金を確認してください。この記事は情報提供のみを目的としており、財務上のアドバイスを構成するものではありません。

Related Articles