チュートリアル

Token Station 経由で Claude Code に任意のモデルを使う

Claude Code は、追加のラッパーやプロキシなしで Token Station に接続できる。Claude Code の接続先を https://models.bytefuture.ai に向け、Token Station のキーを Anthropic auth token として使い、Opus、Sonnet、Haiku、subagent の各リクエストにどの Token Station モデルを使うかを指定する。

設定方法は 2 つある。シェルをまたいで永続化したいなら ~/.claude/settings.json を使う。一時的なセッション、CI ジョブ、または 1 回限りのテストなら、環境変数を export するだけでよい。

方法 1:永続的な settings.json

Claude Code の設定ディレクトリを作り、~/.claude/settings.json に環境変数ブロックを書き込む:

mkdir -p ~/.claude
cat > ~/.claude/settings.json <<'EOF'
{
  "env": {
    "ANTHROPIC_BASE_URL": "https://models.bytefuture.ai",
    "ANTHROPIC_AUTH_TOKEN": "YOUR TOKEN AT TOKEN STATION",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "openai/gpt-5.5",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "openai/gpt-5.4-mini",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "openai/gpt-5.4-nano",
    "CLAUDE_CODE_SUBAGENT_MODEL": "openai/gpt-5.4-mini"
  }
}
EOF

次に、最小のプロンプトで CLI が Token Station を使っているか確認する:

claude -p "Respond with exactly the word: pong"

出力がちょうど pong なら、Claude Code は Token Station に到達し、設定したモデルが応答している。

方法 2:一時的な shell export

設定ファイルを書きたくない場合は、Claude Code を起動する同じ shell で同じ値を export する:

export ANTHROPIC_BASE_URL="https://models.bytefuture.ai"
export ANTHROPIC_AUTH_TOKEN="YOUR TOKEN AT TOKEN STATION"

export ANTHROPIC_DEFAULT_OPUS_MODEL="openai/gpt-5.5"
export ANTHROPIC_DEFAULT_SONNET_MODEL="openai/gpt-5.4-mini"
export ANTHROPIC_DEFAULT_HAIKU_MODEL="openai/gpt-5.4-nano"
export CLAUDE_CODE_SUBAGENT_MODEL="openai/gpt-5.4-mini"

claude -p "Respond with exactly the word: pong"

保存済みの Claude Code 設定を変えずに、別のモデル割り当てを試したいときに向いている。

各変数の意味

変数意味
ANTHROPIC_BASE_URLClaude Code がリクエストを送る API エンドポイント。Token Station では https://models.bytefuture.ai を使う。
ANTHROPIC_AUTH_TOKENToken Station の API キー。ソース管理には入れない。
ANTHROPIC_DEFAULT_OPUS_MODELOpus クラスのリクエストに使うモデル。
ANTHROPIC_DEFAULT_SONNET_MODELSonnet クラスのリクエストに使うモデル。
ANTHROPIC_DEFAULT_HAIKU_MODELHaiku クラスのリクエストに使うモデル。
CLAUDE_CODE_SUBAGENT_MODELClaude Code の subagent に使うモデル。

モデルの選び方

上のモデル ID は単なる割り当てだ。Claude Code の各スロットを別々の Token Station モデルに向けてもよいし、すべて同じモデルにしてもよい。実用的な初期値は、Opus に強いモデルを置き、Sonnet、Haiku、subagent にはより速く安いモデルを置くことだ。

Token Station での出発点として使いやすいモデル:

Claude Code スロットToken Station モデル使う理由
Opusopenai/gpt-5.5難しい設計、デバッグ、アーキテクチャ、長い編集の強い既定値。
Sonnetopenai/gpt-5.4-mini日常的なコーディング、レビュー、リポジトリ調査、リファクタリング向けのバランス型。
Haikuopenai/gpt-5.4-nano短いプロンプト、素早い確認、低コスト・低レイテンシのタスク向け。
Subagentopenai/gpt-5.4-mini委任された調査に十分強く、すべてのサブタスクをフラッグシップ価格にしない。
Alternative Opusanthropic/claude-opus-4-8長期的なコーディングで Claude 系の挙動を明確に使いたいとき。
Budget codingkimi/kimi-k2.7-code最大の推論深度よりコストを重視する定型的な実装作業に向く。

これらの model ID は、上の対応する ANTHROPIC_DEFAULT_* 変数にそのまま入れられる。まずは設定ブロックのバランス型の割り当てから始め、タスクが本当に必要とするときだけ Opus を上げる、または Haiku をさらに安いモデルへ下げるとよい。

うまくつながらないとき

  • まだ既定の Anthropic エンドポイントを使う。ANTHROPIC_BASE_URLclaude を起動する shell にあるか、または ~/.claude/settings.json に入っているか確認する。
  • 401 / 認証エラー。YOUR TOKEN AT TOKEN STATION を実際の Token Station キーに置き換える。
  • 違うモデルが応答する。Opus、Sonnet、Haiku、subagent のモデル変数を確認する。Claude Code はリクエスト種別に応じてこれらのスロットを選ぶ。
  • settings ファイルが効かない。~/.claude/settings.json が正しい JSON であることを確認し、編集後に Claude Code コマンドを実行し直す。

はじめよう

恒久的に使うなら ~/.claude/settings.json。一時的に使うなら現在の shell で変数を export する。どちらの場合も確認方法は同じで、claude -p "Respond with exactly the word: pong" を実行し、pong が返るかを見る。

models.bytefuture.ai で登録し(無料クレジット 10 ドル、カード不要)、Token Station キーを Claude Code に入れ、Claude Code の各モデルスロットを実際に使いたいモデルへ向けよう。


この記事をシェア Post LinkedIn Facebook Hacker News Reddit