Login
Back to Blog
Claude Sonnet 4.5の料金を解説 — キャッシュ、Batch API、Crazyrouterで45%節約する方法

Claude Sonnet 4.5の料金を解説 — キャッシュ、Batch API、Crazyrouterで45%節約する方法

C
Crazyrouter Team
April 27, 2026
1 views日本語Pricing
Share:


title: Claude Sonnet 4.5の料金を解説 — キャッシュ、Batch API、Crazyrouterで45%節約する方法 slug: claude-sonnet-4-5-pricing summary: Claude Sonnet 4.5 APIの料金を徹底解説 — 基本トークンはMTokあたり3/3/15、5分および1時間のプロンプトキャッシュ、Batch API割引、そしてCrazyrouterで請求額を45%削減する方法。 tag: Pricing language: en cover_image_url: https://raw.githubusercontent.com/xujfcn/images/main/blog/covers/claude-sonnet-4-6-pricing.jpg meta_title: Claude Sonnet 4.5の料金 2026年版 — キャッシュ、Batch API、Crazyrouter割引 meta_description: Claude Sonnet 4.5の料金完全ガイド。基本トークン、プロンプトキャッシュ(5分&1時間)、Batch API、データレジデンシー — さらにCrazyrouterで45%節約。 meta_keywords: Claude Sonnet 4.5 pricing, Claude API cost, Anthropic pricing 2026, prompt caching, Crazyrouter discount#

Claude Sonnet 4.5の料金を解説 — キャッシュ、Batch API、Crazyrouterで45%節約する方法#

Claude Sonnet 4.5 (claude-sonnet-4-5-20250929) は、Anthropicの旧世代Sonnetモデルです。Claude Sonnet 4.6のリリース後も、Sonnet 4.5は顧客サポートチャットボットから複雑なコード生成パイプラインまで、あらゆるものに利用される最も広く展開されているモデルの一つです。後継モデルと同じ料金体系であるため、まだ移行していないチームにとっては信頼性が高く、よく理解されている選択肢となっています。

しかし、料金の全体像を理解するには、基本のトークンあたりの料金だけでは不十分です。プロンプトキャッシュのティア、Batch APIの割引、データレジデンシーの乗数、サードパーティのルーティングオプションなど、Sonnet 4.5の実際の運用コストは、その使用方法によって劇的に変動します。

このガイドでは、Claude Sonnet 4.5のあらゆる料金側面を詳細に解説し、実際のコストシナリオを検証し、Crazyrouterを使用してAPI請求額を最大45%削減する方法を紹介します。

最終更新日:2026年4月27日


基本料金#

Claude Sonnet 4.5は、Anthropicの標準的なSonnetティア料金に従います。

コンポーネント100万トークン(MTok)あたりの料金
入力トークン$3.00
出力トークン$15.00

いくつか注意点があります。

  • 入力トークンには、システムプロンプト、ユーザーメッセージ、ツール定義、および渡される会話履歴が含まれます。
  • 出力トークンは、モデルが生成するすべてのもの — アシスタントの応答、ツール呼び出し、思考の連鎖的推論 — です。
  • 出力トークンは入力トークンの5倍のコストがかかるため、出力の長さを最適化することが請求額に大きな影響を与えます。

参考までに、100万トークンは約75万語、つまり長編小説10冊分に相当します。適度なシステムプロンプトと数ターンの会話を含む典型的なAPI呼び出しでは、2,000~5,000の入力トークンと500~2,000の出力トークンを使用する場合があります。

簡単なコスト例: 3,000の入力トークンと1,000の出力トークンを含む1回のリクエストのコストは次のとおりです。

code
入力:  3,000 / 1,000,000 × $3.00  = $0.009
出力: 1,000 / 1,000,000 × $15.00 = $0.015
合計:  1リクエストあたり$0.024

1日あたり10,000リクエストの場合、これは1日あたり240、または約月あたり240**、または約**月あたり7,200になります — 最適化を行う前の金額です。


プロンプトキャッシュ — 最大のコスト削減レバー#

プロンプトキャッシュは、真の節約が実現される場所です。同じシステムプロンプト、ツール定義、またはfew-shotの例を複数のリクエストで送信している場合、キャッシュを有効にしない限り、毎回同じトークンに対して全額を支払うことになります。

Anthropicは、Claude Sonnet 4.5用に2つのキャッシュティアを提供しています。

キャッシュの書き込み、キャッシュヒット、有効期限を示すプロンプトキャッシュフロー図

キャッシュ料金の内訳#

操作MTokあたりの料金基本入力に対する倍率
基本入力(キャッシュなし)$3.001.0×
5分キャッシュ書き込み$3.751.25×
1時間キャッシュ書き込み$6.002.0×
キャッシュヒット(読み取り)$0.300.1×

仕組みは次のとおりです。

  1. キャッシュ書き込み — キャッシュ可能なプレフィックスを含む最初のリクエストは、書き込みプレミアム(5分TTLの場合は1.25倍、1時間TTLの場合は2.0倍)を支払います。
  2. キャッシュヒット — キャッシュされたプレフィックスに一致する後続のリクエストは、$0.30/MTokのみを支払います — これは入力トークンに対して90%の割引です。
  3. キャッシュミス — キャッシュの有効期限が切れたり、プレフィックスが一致しない場合、再度全額の書き込みコストを支払います。

どのキャッシュTTLを選択すべきか?#

  • 5分キャッシュ($3.75/MTok書き込み): バースト的なワークロードに最適 — 複数の同時ユーザーを処理するチャットボット、リアルタイムのコーディングアシスタント、またはリクエストがクラスターで発生するあらゆるシナリオ。
  • 1時間キャッシュ($6.00/MTok書き込み): 安定した継続的なワークロードに最適 — バックグラウンド処理パイプライン、スケジュールされたタスク、または1時間を通して一貫したトラフィックを持つアプリケーション。

損益分岐点計算#

重要な質問:キャッシュ書き込みコストの元を取るには、いくつのキャッシュヒットが必要ですか?

5分キャッシュの場合:

code
損益分岐点: cache_write_premium / savings_per_hit
MTokあたりのプレミアム:    $3.75 - $3.00 = $0.75
1ヒットあたりの節約:     $3.00 - $0.30 = $2.70

損益分岐点 = $0.75 / $2.70 ≈ 0.28ヒット

5分以内に追加のキャッシュヒットが1回発生するだけで、元が取れます。キャッシュされたプレフィックスが4,000トークンで、5分以内に2回以上のリクエストを行う場合、キャッシュは費用を節約します。

1時間キャッシュの場合:

code
MTokあたりのプレミアム:    $6.00 - $3.00 = $3.00
1ヒットあたりの節約:     $3.00 - $0.30 = $2.70

損益分岐点 = $3.00 / $2.70 ≈ 1.11ヒット

元を取るには、1時間以内に2回のキャッシュヒットが必要です。同じプレフィックスで1時間あたり2回以上のリクエストを行うアプリケーションであれば、1時間キャッシュは元が取れます。

キャッシュのコード例 (Python)#

python
import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    system=[
        {
            "type": "text",
            "text": "You are a senior software engineer assistant. You help with code reviews, debugging, and architecture decisions. Always provide specific, actionable feedback with code examples.",
            "cache_control": {"type": "ephemeral"}  # 5-minute TTL
        }
    ],
    messages=[
        {"role": "user", "content": "Review this Python function for potential issues..."}
    ]
)

# Check cache performance in the response
usage = response.usage
print(f"Input tokens:        {usage.input_tokens}")
print(f"Cache creation:      {usage.cache_creation_input_tokens}")
print(f"Cache read (hits):   {usage.cache_read_input_tokens}")

1時間キャッシュの場合、キャッシュコントロールタイプを変更します。

python
"cache_control": {"type": "ephemeral", "ttl": 3600}  # 1-hour TTL

キャッシュのベストプラクティス#

  • 安定したコンテンツを最初に配置する。 システムプロンプト、ツール定義、few-shotの例は、メッセージの先頭に配置する必要があります — キャッシュはプレフィックスの先頭から一致します。
  • キャッシュ可能な最小長は1,024トークンです(Sonnetモデルの場合)。短いプレフィックスはキャッシュされません。
  • キャッシュヒット率を監視する。 50%を下回る場合は、キャッシュ戦略を見直すか、TTLティアを切り替えることを検討してください。
  • 会話管理と組み合わせる。 マルチターンのチャットでは、システムプロンプトとツール定義をキャッシュし、新しいターンはキャッシュされたプレフィックスの外に追加します。

Batch API — 非同期ワークロードで50%オフ#

リアルタイムの応答を必要としないワークロードの場合、Batch APIはコストを半分に削減します。

コンポーネント標準料金Batch API料金節約額
入力トークン$3.00/MTok$1.50/MTok50%
出力トークン$15.00/MTok$7.50/MTok50%

Batch APIは、リクエストを非同期で処理し、24時間の完了保証期間があります(ただし、ほとんどのバッチははるかに早く完了します)。以下の用途に最適です。

  • データ処理と分類 — 数千のサポートチケットやドキュメントの分類。
  • コンテンツ生成 — 製品説明、要約、翻訳の一括生成。
  • 評価とテスト — 大規模なテストセットでのモデル評価の実行。
  • 埋め込みと分析 — レイテンシが問題にならない大規模なデータセットの処理。

Batch APIの例#

python
import anthropic

client = anthropic.Anthropic()

# Create a batch
batch = client.batches.create(
    requests=[
        {
            "custom_id": "request-001",
            "params": {
                "model": "claude-sonnet-4-5-20250929",
                "max_tokens": 512,
                "messages": [
                    {"role": "user", "content": "Summarize this article: ..."}
                ]
            }
        },
        {
            "custom_id": "request-002",
            "params": {
                "model": "claude-sonnet-4-5-20250929",
                "max_tokens": 512,
                "messages": [
                    {"role": "user", "content": "Classify this support ticket: ..."}
                ]
            }
        }
        # ... up to 100,000 requests per batch
    ]
)

print(f"Batch ID: {batch.id}")
print(f"Status: {batch.processing_status}")

プロのヒント: Batch APIとプロンプトキャッシュを組み合わせることで、さらに深い節約が可能です。バッチ内のキャッシュされた入力トークンは、わずか**0.15/MTok0.15/MTok**(0.30のキャッシュヒット料金から50%オフ)になります。


データレジデンシー — 米国のみの処理#

データ主権要件を持つ組織向けに、Anthropicはすべての処理が米国内で行われることを保証する米国データレジデンシーオプションを提供しています。

コンポーネント標準米国データレジデンシー
入力トークン$3.00/MTok$3.30/MTok
出力トークン$15.00/MTok$16.50/MTok
乗数1.0×1.1×

10%のプレミアムは、キャッシュされたトークンを含むすべてのトークンタイプに適用されます。これは主に、米国のデータ処理規制の対象となる医療、金融、政府のアプリケーションに関連します。


Crazyrouterの料金 — すべてのリクエストで45%節約#

ここからが面白いところです。Crazyrouterは、Claude Sonnet 4.5をAnthropicの公式料金の**55%**で提供しています — 入力トークンと出力トークンの両方で一律45%の割引です。

Anthropic直接料金とCrazyrouter料金のコスト比較チャート

コンポーネントAnthropic直接Crazyrouter節約額
入力トークン$3.00/MTok$1.65/MTok45%
出力トークン$15.00/MTok$8.25/MTok45%

Crazyrouterは、OpenAI SDK形式とAnthropicのネイティブSDKの両方と完全に互換性のある統合APIゲートウェイです。base URLを変更するだけで切り替え可能で、コードの書き換えは不要です。

OpenAI互換SDK (Python)#

python
from openai import OpenAI

client = OpenAI(
    api_key="your-crazyrouter-api-key",
    base_url="https://crazyrouter.com/v1"
)

response = client.chat.completions.create(
    model="claude-sonnet-4-5-20250929",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Explain quantum computing in simple terms."}
    ],
    max_tokens=1024
)

print(response.choices[0].message.content)

AnthropicネイティブSDK (Python)#

python
import anthropic

client = anthropic.Anthropic(
    api_key="your-crazyrouter-api-key",
    base_url="https://crazyrouter.com"
)

response = client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Explain quantum computing in simple terms."}
    ]
)

print(response.content[0].text)

cURL#

bash
curl -X POST https://crazyrouter.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer your-crazyrouter-api-key" \
  -d '{
    "model": "claude-sonnet-4-5-20250929",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "Explain quantum computing in simple terms."}
    ],
    "max_tokens": 1024
  }'

Crazyrouterを選ぶ理由#

  • コード変更不要 — ドロップインで置き換え可能。base URLとAPIキーを変更するだけで、他はすべてそのまま。
  • OpenAI互換 — OpenAI API形式をサポートするあらゆるツールやフレームワーク(LangChain、LlamaIndex、Vercel AI SDKなど)で動作。
  • すべてのClaudeモデル — すべての世代のOpus、Sonnet、Haikuにアクセス可能。
  • ストリーミングサポート — 完全なSSEストリーミング、関数呼び出し、ツール使用。
  • 従量課金制 — 最低料金なし、コミットメントなし。チャージしてすぐに節約を開始。

実際のコスト比較 — 3つのシナリオ#

一般的な3つのユースケースについて、Anthropicの直接料金とCrazyrouterの料金を比較して、具体的な数字を見てみましょう。

シナリオ1:顧客サポートチャットボット#

1日あたり5,000件の会話を処理し、平均4ターンで対応する中規模SaaS企業。

指標
1日あたりのリクエスト数20,000
1リクエストあたりの平均入力トークン数3,500(システムプロンプト+履歴を含む)
1リクエストあたりの平均出力トークン数800
キャッシュヒット率70%(システムプロンプトがキャッシュされている)
キャッシュ可能なプレフィックス2,000トークン

月間コスト(Anthropic直接):

code
非キャッシュ入力:  20,000 × 30 × 1,500 / 1M × $3.00    = $2,700
キャッシュ入力:      20,000 × 30 × 2,000 / 1M × $0.30     = $360
キャッシュ書き込み:      20,000 × 30 × 0.30 × 2,000 / 1M × $3.75 = $1,350
出力:            20,000 × 30 × 800 / 1M × $15.00       = $7,200
合計: 約$11,610/月

月間コスト(Crazyrouterで45%オフ):

code
$11,610 × 0.55 = 約$6,386/月
節約額: $5,224/月(年間$62,688)

シナリオ2:コードレビューパイプライン (Batch API)#

500件のプルリクエストに対して夜間バッチコードレビューを実行する開発チーム。

指標
1晩あたりのバッチリクエスト数500
1リクエストあたりの平均入力トークン数8,000(コード+コンテキスト)
1リクエストあたりの平均出力トークン数2,000(詳細レビュー)
頻度夜間(月30回)

月間コスト(Anthropic Batch API):

code
入力:  500 × 30 × 8,000 / 1M × $1.50  = $180
出力: 500 × 30 × 2,000 / 1M × $7.50  = $225
合計: $405/月

月間コスト(Crazyrouter、標準APIで45%オフ):

code
入力:  500 × 30 × 8,000 / 1M × $1.65  = $198
出力: 500 × 30 × 2,000 / 1M × $8.25  = $247.50
合計: $445.50/月

この場合、AnthropicのBatch APIの方がわずかに安価です(405vs405 vs 445.50) — しかし、Crazyrouterは最大24時間待つ代わりにリアルタイムの応答を提供します。レイテンシが少しでも重要であれば、Crazyrouterが優位です。

シナリオ3:大量コンテンツ生成#

重いシステムプロンプトとfew-shotの例を使用して、1日あたり2,000件の記事を生成するコンテンツプラットフォーム。

指標
1日あたりのリクエスト数2,000
1リクエストあたりの平均入力トークン数12,000(システム+例+指示)
1リクエストあたりの平均出力トークン数3,000(完全な記事)
キャッシュヒット率90%(安定したシステムプロンプト)
キャッシュ可能なプレフィックス8,000トークン

月間コスト(Anthropic直接、キャッシュあり):

code
非キャッシュ入力:  2,000 × 30 × 4,000 / 1M × $3.00      = $720
キャッシュ入力:      2,000 × 30 × 8,000 / 1M × $0.30       = $144
キャッシュ書き込み:      2,000 × 30 × 0.10 × 8,000 / 1M × $3.75 = $180
出力:            2,000 × 30 × 3,000 / 1M × $15.00       = $2,700
合計: 約$3,744/月

月間コスト(Crazyrouterで45%オフ):

code
$3,744 × 0.55 = 約$2,059/月
節約額: $1,685/月(年間$20,220)

Claude Sonnet 4.5 vs Sonnet 4.6 — どちらを使うべきか?#

簡単な比較は次のとおりです。

側面Sonnet 4.5Sonnet 4.6
モデルIDclaude-sonnet-4-5-20250929claude-sonnet-4-6-20250514
入力料金$3.00/MTok$3.00/MTok
出力料金$15.00/MTok$15.00/MTok
キャッシュ料金同じ同じ
コンテキストウィンドウ200Kトークン200Kトークン
最大出力16,384トークン16,384トークン
ステータス旧世代現行世代

料金は同じです。Sonnet 4.6は、推論能力の向上、指示へのより良い追従、幻覚率の低減が図られた新しいモデルです。特定の回帰の懸念や、4.5で広範に検証された本番パイプラインがない限り、Sonnet 4.6へのアップグレードをお勧めします

移行は1行の変更で済みます。

python
# Before
model = "claude-sonnet-4-5-20250929"

# After
model = "claude-sonnet-4-6-20250514"

どちらのモデルも、Crazyrouterで同じ45%割引で利用できます。


主要なポイント#

  1. 基本料金は入力/出力でMTokあたり3/3/15です。出力トークンは5倍高価なので、まず応答の長さを最適化しましょう。

  2. プロンプトキャッシュは、あらゆる本番ワークロードにとって必須です。5分キャッシュは1ヒットで元が取れ、1時間キャッシュは2ヒットで元が取れます。70%以上のキャッシュヒット率があれば、入力トークンコストを60~80%節約できます。

  3. Batch APIは50%節約できますが、レイテンシ(最大24時間)が追加されます。リアルタイムの応答が不要なオフライン処理に使用してください。

  4. データレジデンシーは10%追加されます — 規制要件がある場合にのみ支払うようにしてください。

  5. Crazyrouterは、コード変更なしで全体的に45%節約できます。典型的な本番ワークロードの場合、年間5,0005,000~60,000以上の節約になります。

  6. Sonnet 4.5と4.6の料金は同じです。追加費用なしでより良いパフォーマンスを得るために、4.6にアップグレードしてください。


今すぐ節約を始めましょう#

Crazyrouterの利用開始はわずか2分です。

  1. crazyrouter.comサインアップ
  2. ダッシュボードからAPIキーを取得
  3. base URLをhttps://crazyrouter.com/v1に変更
  4. これだけです。 すべてのClaude API呼び出しが45%安くなります。

契約なし。最低料金なし。ベンダーロックインなし。ただ、より安価なトークンを。

crazyrouter.comでAPIキーを取得


免責事項:料金情報は2026年4月27日時点のものです。Anthropicはいつでも料金を更新する可能性があります。常にAnthropicの公式料金ページおよびCrazyrouterの料金ページで現在の料金を確認してください。提示されたコストシナリオは、一般的な使用パターンに基づいた推定であり、特定の実装によって異なる場合があります。Crazyrouterは独立したAPIゲートウェイであり、Anthropicとは提携していません。

Related Articles