Claude Sonnet 4.5の料金を解説 — キャッシュ、Batch API、Crazyrouterで45%節約する方法

title: Claude Sonnet 4.5の料金を解説 — キャッシュ、Batch API、Crazyrouterで45%節約する方法 slug: claude-sonnet-4-5-pricing summary: Claude Sonnet 4.5 APIの料金を徹底解説 — 基本トークンはMTokあたり $3/$ 15、5分および1時間のプロンプトキャッシュ、Batch API割引、そしてCrazyrouterで請求額を45%削減する方法。 tag: Pricing language: en cover_image_url: https://raw.githubusercontent.com/xujfcn/images/main/blog/covers/claude-sonnet-4-6-pricing.jpg meta_title: Claude Sonnet 4.5の料金 2026年版 — キャッシュ、Batch API、Crazyrouter割引 meta_description: Claude Sonnet 4.5の料金完全ガイド。基本トークン、プロンプトキャッシュ（5分＆1時間）、Batch API、データレジデンシー — さらにCrazyrouterで45%節約。 meta_keywords: Claude Sonnet 4.5 pricing, Claude API cost, Anthropic pricing 2026, prompt caching, Crazyrouter discount#

Claude Sonnet 4.5の料金を解説 — キャッシュ、Batch API、Crazyrouterで45%節約する方法#

Claude Sonnet 4.5 (claude-sonnet-4-5-20250929) は、Anthropicの旧世代Sonnetモデルです。Claude Sonnet 4.6のリリース後も、Sonnet 4.5は顧客サポートチャットボットから複雑なコード生成パイプラインまで、あらゆるものに利用される最も広く展開されているモデルの一つです。後継モデルと同じ料金体系であるため、まだ移行していないチームにとっては信頼性が高く、よく理解されている選択肢となっています。

しかし、料金の全体像を理解するには、基本のトークンあたりの料金だけでは不十分です。プロンプトキャッシュのティア、Batch APIの割引、データレジデンシーの乗数、サードパーティのルーティングオプションなど、Sonnet 4.5の実際の運用コストは、その使用方法によって劇的に変動します。

このガイドでは、Claude Sonnet 4.5のあらゆる料金側面を詳細に解説し、実際のコストシナリオを検証し、Crazyrouterを使用してAPI請求額を最大45%削減する方法を紹介します。

最終更新日：2026年4月27日

基本料金#

Claude Sonnet 4.5は、Anthropicの標準的なSonnetティア料金に従います。

コンポーネント	100万トークン（MTok）あたりの料金
入力トークン	$3.00
出力トークン	$15.00

いくつか注意点があります。

入力トークンには、システムプロンプト、ユーザーメッセージ、ツール定義、および渡される会話履歴が含まれます。
出力トークンは、モデルが生成するすべてのもの — アシスタントの応答、ツール呼び出し、思考の連鎖的推論 — です。
出力トークンは入力トークンの5倍のコストがかかるため、出力の長さを最適化することが請求額に大きな影響を与えます。

参考までに、100万トークンは約75万語、つまり長編小説10冊分に相当します。適度なシステムプロンプトと数ターンの会話を含む典型的なAPI呼び出しでは、2,000～5,000の入力トークンと500～2,000の出力トークンを使用する場合があります。

簡単なコスト例： 3,000の入力トークンと1,000の出力トークンを含む1回のリクエストのコストは次のとおりです。

code

入力:  3,000 / 1,000,000 × $3.00  = $0.009
出力: 1,000 / 1,000,000 × $15.00 = $0.015
合計:  1リクエストあたり$0.024

1日あたり10,000リクエストの場合、これは1日あたり $240**、または約**月あたり$ 7,200になります — 最適化を行う前の金額です。

プロンプトキャッシュ — 最大のコスト削減レバー#

プロンプトキャッシュは、真の節約が実現される場所です。同じシステムプロンプト、ツール定義、またはfew-shotの例を複数のリクエストで送信している場合、キャッシュを有効にしない限り、毎回同じトークンに対して全額を支払うことになります。

Anthropicは、Claude Sonnet 4.5用に2つのキャッシュティアを提供しています。

キャッシュの書き込み、キャッシュヒット、有効期限を示すプロンプトキャッシュフロー図

キャッシュ料金の内訳#

操作	MTokあたりの料金	基本入力に対する倍率
基本入力（キャッシュなし）	$3.00	1.0×
5分キャッシュ書き込み	$3.75	1.25×
1時間キャッシュ書き込み	$6.00	2.0×
キャッシュヒット（読み取り）	$0.30	0.1×

仕組みは次のとおりです。

キャッシュ書き込み — キャッシュ可能なプレフィックスを含む最初のリクエストは、書き込みプレミアム（5分TTLの場合は1.25倍、1時間TTLの場合は2.0倍）を支払います。
キャッシュヒット — キャッシュされたプレフィックスに一致する後続のリクエストは、$0.30/MTokのみを支払います — これは入力トークンに対して90%の割引です。
キャッシュミス — キャッシュの有効期限が切れたり、プレフィックスが一致しない場合、再度全額の書き込みコストを支払います。

どのキャッシュTTLを選択すべきか？#

5分キャッシュ（$3.75/MTok書き込み）： バースト的なワークロードに最適 — 複数の同時ユーザーを処理するチャットボット、リアルタイムのコーディングアシスタント、またはリクエストがクラスターで発生するあらゆるシナリオ。
1時間キャッシュ（$6.00/MTok書き込み）： 安定した継続的なワークロードに最適 — バックグラウンド処理パイプライン、スケジュールされたタスク、または1時間を通して一貫したトラフィックを持つアプリケーション。

損益分岐点計算#

重要な質問：キャッシュ書き込みコストの元を取るには、いくつのキャッシュヒットが必要ですか？

5分キャッシュの場合：

code

損益分岐点: cache_write_premium / savings_per_hit
MTokあたりのプレミアム:    $3.75 - $3.00 = $0.75
1ヒットあたりの節約:     $3.00 - $0.30 = $2.70

損益分岐点 = $0.75 / $2.70 ≈ 0.28ヒット

5分以内に追加のキャッシュヒットが1回発生するだけで、元が取れます。キャッシュされたプレフィックスが4,000トークンで、5分以内に2回以上のリクエストを行う場合、キャッシュは費用を節約します。

1時間キャッシュの場合：

code

MTokあたりのプレミアム:    $6.00 - $3.00 = $3.00
1ヒットあたりの節約:     $3.00 - $0.30 = $2.70

損益分岐点 = $3.00 / $2.70 ≈ 1.11ヒット

元を取るには、1時間以内に2回のキャッシュヒットが必要です。同じプレフィックスで1時間あたり2回以上のリクエストを行うアプリケーションであれば、1時間キャッシュは元が取れます。

キャッシュのコード例 (Python)#

python

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    system=[
        {
            "type": "text",
            "text": "You are a senior software engineer assistant. You help with code reviews, debugging, and architecture decisions. Always provide specific, actionable feedback with code examples.",
            "cache_control": {"type": "ephemeral"}  # 5-minute TTL
        }
    ],
    messages=[
        {"role": "user", "content": "Review this Python function for potential issues..."}
    ]
)

# Check cache performance in the response
usage = response.usage
print(f"Input tokens:        {usage.input_tokens}")
print(f"Cache creation:      {usage.cache_creation_input_tokens}")
print(f"Cache read (hits):   {usage.cache_read_input_tokens}")

1時間キャッシュの場合、キャッシュコントロールタイプを変更します。

python

"cache_control": {"type": "ephemeral", "ttl": 3600}  # 1-hour TTL

キャッシュのベストプラクティス#

安定したコンテンツを最初に配置する。 システムプロンプト、ツール定義、few-shotの例は、メッセージの先頭に配置する必要があります — キャッシュはプレフィックスの先頭から一致します。
キャッシュ可能な最小長は1,024トークンです（Sonnetモデルの場合）。短いプレフィックスはキャッシュされません。
キャッシュヒット率を監視する。 50%を下回る場合は、キャッシュ戦略を見直すか、TTLティアを切り替えることを検討してください。
会話管理と組み合わせる。 マルチターンのチャットでは、システムプロンプトとツール定義をキャッシュし、新しいターンはキャッシュされたプレフィックスの外に追加します。

Batch API — 非同期ワークロードで50%オフ#

リアルタイムの応答を必要としないワークロードの場合、Batch APIはコストを半分に削減します。

コンポーネント	標準料金	Batch API料金	節約額
入力トークン	$3.00/MTok	$1.50/MTok	50%
出力トークン	$15.00/MTok	$7.50/MTok	50%

Batch APIは、リクエストを非同期で処理し、24時間の完了保証期間があります（ただし、ほとんどのバッチははるかに早く完了します）。以下の用途に最適です。

データ処理と分類 — 数千のサポートチケットやドキュメントの分類。
コンテンツ生成 — 製品説明、要約、翻訳の一括生成。
評価とテスト — 大規模なテストセットでのモデル評価の実行。
埋め込みと分析 — レイテンシが問題にならない大規模なデータセットの処理。

Batch APIの例#

python

import anthropic

client = anthropic.Anthropic()

# Create a batch
batch = client.batches.create(
    requests=[
        {
            "custom_id": "request-001",
            "params": {
                "model": "claude-sonnet-4-5-20250929",
                "max_tokens": 512,
                "messages": [
                    {"role": "user", "content": "Summarize this article: ..."}
                ]
            }
        },
        {
            "custom_id": "request-002",
            "params": {
                "model": "claude-sonnet-4-5-20250929",
                "max_tokens": 512,
                "messages": [
                    {"role": "user", "content": "Classify this support ticket: ..."}
                ]
            }
        }
        # ... up to 100,000 requests per batch
    ]
)

print(f"Batch ID: {batch.id}")
print(f"Status: {batch.processing_status}")

プロのヒント： Batch APIとプロンプトキャッシュを組み合わせることで、さらに深い節約が可能です。バッチ内のキャッシュされた入力トークンは、わずか** $0.15/MTok**（$ 0.30のキャッシュヒット料金から50%オフ）になります。

データレジデンシー — 米国のみの処理#

データ主権要件を持つ組織向けに、Anthropicはすべての処理が米国内で行われることを保証する米国データレジデンシーオプションを提供しています。

コンポーネント	標準	米国データレジデンシー
入力トークン	$3.00/MTok	$3.30/MTok
出力トークン	$15.00/MTok	$16.50/MTok
乗数	1.0×	1.1×

10%のプレミアムは、キャッシュされたトークンを含むすべてのトークンタイプに適用されます。これは主に、米国のデータ処理規制の対象となる医療、金融、政府のアプリケーションに関連します。

Crazyrouterの料金 — すべてのリクエストで45%節約#

ここからが面白いところです。Crazyrouterは、Claude Sonnet 4.5をAnthropicの公式料金の**55%**で提供しています — 入力トークンと出力トークンの両方で一律45%の割引です。

Anthropic直接料金とCrazyrouter料金のコスト比較チャート

コンポーネント	Anthropic直接	Crazyrouter	節約額
入力トークン	$3.00/MTok	$1.65/MTok	45%
出力トークン	$15.00/MTok	$8.25/MTok	45%

Crazyrouterは、OpenAI SDK形式とAnthropicのネイティブSDKの両方と完全に互換性のある統合APIゲートウェイです。base URLを変更するだけで切り替え可能で、コードの書き換えは不要です。

OpenAI互換SDK (Python)#

python

from openai import OpenAI

client = OpenAI(
    api_key="your-crazyrouter-api-key",
    base_url="https://crazyrouter.com/v1"
)

response = client.chat.completions.create(
    model="claude-sonnet-4-5-20250929",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Explain quantum computing in simple terms."}
    ],
    max_tokens=1024
)

print(response.choices[0].message.content)

AnthropicネイティブSDK (Python)#

python

import anthropic

client = anthropic.Anthropic(
    api_key="your-crazyrouter-api-key",
    base_url="https://crazyrouter.com"
)

response = client.messages.create(
    model="claude-sonnet-4-5-20250929",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Explain quantum computing in simple terms."}
    ]
)

print(response.content[0].text)

cURL#

bash

curl -X POST https://crazyrouter.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer your-crazyrouter-api-key" \
  -d '{
    "model": "claude-sonnet-4-5-20250929",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "Explain quantum computing in simple terms."}
    ],
    "max_tokens": 1024
  }'

Crazyrouterを選ぶ理由#

コード変更不要 — ドロップインで置き換え可能。base URLとAPIキーを変更するだけで、他はすべてそのまま。
OpenAI互換 — OpenAI API形式をサポートするあらゆるツールやフレームワーク（LangChain、LlamaIndex、Vercel AI SDKなど）で動作。
すべてのClaudeモデル — すべての世代のOpus、Sonnet、Haikuにアクセス可能。
ストリーミングサポート — 完全なSSEストリーミング、関数呼び出し、ツール使用。
従量課金制 — 最低料金なし、コミットメントなし。チャージしてすぐに節約を開始。

実際のコスト比較 — 3つのシナリオ#

一般的な3つのユースケースについて、Anthropicの直接料金とCrazyrouterの料金を比較して、具体的な数字を見てみましょう。

シナリオ1：顧客サポートチャットボット#

1日あたり5,000件の会話を処理し、平均4ターンで対応する中規模SaaS企業。

指標	値
1日あたりのリクエスト数	20,000
1リクエストあたりの平均入力トークン数	3,500（システムプロンプト＋履歴を含む）
1リクエストあたりの平均出力トークン数	800
キャッシュヒット率	70%（システムプロンプトがキャッシュされている）
キャッシュ可能なプレフィックス	2,000トークン

月間コスト（Anthropic直接）：

code

非キャッシュ入力:  20,000 × 30 × 1,500 / 1M × $3.00    = $2,700
キャッシュ入力:      20,000 × 30 × 2,000 / 1M × $0.30     = $360
キャッシュ書き込み:      20,000 × 30 × 0.30 × 2,000 / 1M × $3.75 = $1,350
出力:            20,000 × 30 × 800 / 1M × $15.00       = $7,200
合計: 約$11,610/月

月間コスト（Crazyrouterで45%オフ）：

code

$11,610 × 0.55 = 約$6,386/月
節約額: $5,224/月（年間$62,688）

シナリオ2：コードレビューパイプライン (Batch API)#

500件のプルリクエストに対して夜間バッチコードレビューを実行する開発チーム。

指標	値
1晩あたりのバッチリクエスト数	500
1リクエストあたりの平均入力トークン数	8,000（コード＋コンテキスト）
1リクエストあたりの平均出力トークン数	2,000（詳細レビュー）
頻度	夜間（月30回）

月間コスト（Anthropic Batch API）：

code

入力:  500 × 30 × 8,000 / 1M × $1.50  = $180
出力: 500 × 30 × 2,000 / 1M × $7.50  = $225
合計: $405/月

月間コスト（Crazyrouter、標準APIで45%オフ）：

code

入力:  500 × 30 × 8,000 / 1M × $1.65  = $198
出力: 500 × 30 × 2,000 / 1M × $8.25  = $247.50
合計: $445.50/月

この場合、AnthropicのBatch APIの方がわずかに安価です（ $405 vs$ 445.50） — しかし、Crazyrouterは最大24時間待つ代わりにリアルタイムの応答を提供します。レイテンシが少しでも重要であれば、Crazyrouterが優位です。

シナリオ3：大量コンテンツ生成#

重いシステムプロンプトとfew-shotの例を使用して、1日あたり2,000件の記事を生成するコンテンツプラットフォーム。

指標	値
1日あたりのリクエスト数	2,000
1リクエストあたりの平均入力トークン数	12,000（システム＋例＋指示）
1リクエストあたりの平均出力トークン数	3,000（完全な記事）
キャッシュヒット率	90%（安定したシステムプロンプト）
キャッシュ可能なプレフィックス	8,000トークン

月間コスト（Anthropic直接、キャッシュあり）：

code

非キャッシュ入力:  2,000 × 30 × 4,000 / 1M × $3.00      = $720
キャッシュ入力:      2,000 × 30 × 8,000 / 1M × $0.30       = $144
キャッシュ書き込み:      2,000 × 30 × 0.10 × 8,000 / 1M × $3.75 = $180
出力:            2,000 × 30 × 3,000 / 1M × $15.00       = $2,700
合計: 約$3,744/月

月間コスト（Crazyrouterで45%オフ）：

code

$3,744 × 0.55 = 約$2,059/月
節約額: $1,685/月（年間$20,220）

Claude Sonnet 4.5 vs Sonnet 4.6 — どちらを使うべきか？#

簡単な比較は次のとおりです。

側面	Sonnet 4.5	Sonnet 4.6
モデルID	`claude-sonnet-4-5-20250929`	`claude-sonnet-4-6-20250514`
入力料金	$3.00/MTok	$3.00/MTok
出力料金	$15.00/MTok	$15.00/MTok
キャッシュ料金	同じ	同じ
コンテキストウィンドウ	200Kトークン	200Kトークン
最大出力	16,384トークン	16,384トークン
ステータス	旧世代	現行世代

料金は同じです。Sonnet 4.6は、推論能力の向上、指示へのより良い追従、幻覚率の低減が図られた新しいモデルです。特定の回帰の懸念や、4.5で広範に検証された本番パイプラインがない限り、Sonnet 4.6へのアップグレードをお勧めします。

移行は1行の変更で済みます。

python

# Before
model = "claude-sonnet-4-5-20250929"

# After
model = "claude-sonnet-4-6-20250514"

どちらのモデルも、Crazyrouterで同じ45%割引で利用できます。

主要なポイント#

基本料金は入力/出力でMTokあたり $3/$ 15です。出力トークンは5倍高価なので、まず応答の長さを最適化しましょう。
プロンプトキャッシュは、あらゆる本番ワークロードにとって必須です。5分キャッシュは1ヒットで元が取れ、1時間キャッシュは2ヒットで元が取れます。70%以上のキャッシュヒット率があれば、入力トークンコストを60～80%節約できます。
Batch APIは50%節約できますが、レイテンシ（最大24時間）が追加されます。リアルタイムの応答が不要なオフライン処理に使用してください。
データレジデンシーは10%追加されます — 規制要件がある場合にのみ支払うようにしてください。
Crazyrouterは、コード変更なしで全体的に45%節約できます。典型的な本番ワークロードの場合、年間 $5,000～$ 60,000以上の節約になります。
Sonnet 4.5と4.6の料金は同じです。追加費用なしでより良いパフォーマンスを得るために、4.6にアップグレードしてください。

今すぐ節約を始めましょう#

Crazyrouterの利用開始はわずか2分です。

crazyrouter.comでサインアップ
ダッシュボードからAPIキーを取得
base URLをhttps://crazyrouter.com/v1に変更
これだけです。 すべてのClaude API呼び出しが45%安くなります。

契約なし。最低料金なし。ベンダーロックインなし。ただ、より安価なトークンを。

→ crazyrouter.comでAPIキーを取得

免責事項：料金情報は2026年4月27日時点のものです。Anthropicはいつでも料金を更新する可能性があります。常にAnthropicの公式料金ページおよびCrazyrouterの料金ページで現在の料金を確認してください。提示されたコストシナリオは、一般的な使用パターンに基づいた推定であり、特定の実装によって異なる場合があります。Crazyrouterは独立したAPIゲートウェイであり、Anthropicとは提携していません。

Claude Sonnet 4.5の料金を解説 — キャッシュ、Batch API、Crazyrouterで45%節約する方法