Token Station 経由で Claude Code に任意のモデルを使う

Claude Code は、追加のラッパーやプロキシなしで Token Station に接続できる。Claude Code の接続先を https://models.bytefuture.ai に向け、Token Station のキーを Anthropic auth token として使い、Opus、Sonnet、Haiku、subagent の各リクエストにどの Token Station モデルを使うかを指定する。

設定方法は 2 つある。シェルをまたいで永続化したいなら ~/.claude/settings.json を使う。一時的なセッション、CI ジョブ、または 1 回限りのテストなら、環境変数を export するだけでよい。

方法 1：永続的な settings.json

Claude Code の設定ディレクトリを作り、~/.claude/settings.json に環境変数ブロックを書き込む：

mkdir -p ~/.claude
cat > ~/.claude/settings.json <<'EOF'
{
  "env": {
    "ANTHROPIC_BASE_URL": "https://models.bytefuture.ai",
    "ANTHROPIC_AUTH_TOKEN": "YOUR TOKEN AT TOKEN STATION",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "openai/gpt-5.5",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "openai/gpt-5.4-mini",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "openai/gpt-5.4-nano",
    "CLAUDE_CODE_SUBAGENT_MODEL": "openai/gpt-5.4-mini"
  }
}
EOF

次に、最小のプロンプトで CLI が Token Station を使っているか確認する：

claude -p "Respond with exactly the word: pong"

出力がちょうど pong なら、Claude Code は Token Station に到達し、設定したモデルが応答している。

方法 2：一時的な shell export

設定ファイルを書きたくない場合は、Claude Code を起動する同じ shell で同じ値を export する：

export ANTHROPIC_BASE_URL="https://models.bytefuture.ai"
export ANTHROPIC_AUTH_TOKEN="YOUR TOKEN AT TOKEN STATION"

export ANTHROPIC_DEFAULT_OPUS_MODEL="openai/gpt-5.5"
export ANTHROPIC_DEFAULT_SONNET_MODEL="openai/gpt-5.4-mini"
export ANTHROPIC_DEFAULT_HAIKU_MODEL="openai/gpt-5.4-nano"
export CLAUDE_CODE_SUBAGENT_MODEL="openai/gpt-5.4-mini"

claude -p "Respond with exactly the word: pong"

保存済みの Claude Code 設定を変えずに、別のモデル割り当てを試したいときに向いている。

各変数の意味

変数	意味
`ANTHROPIC_BASE_URL`	Claude Code がリクエストを送る API エンドポイント。Token Station では `https://models.bytefuture.ai` を使う。
`ANTHROPIC_AUTH_TOKEN`	Token Station の API キー。ソース管理には入れない。
`ANTHROPIC_DEFAULT_OPUS_MODEL`	Opus クラスのリクエストに使うモデル。
`ANTHROPIC_DEFAULT_SONNET_MODEL`	Sonnet クラスのリクエストに使うモデル。
`ANTHROPIC_DEFAULT_HAIKU_MODEL`	Haiku クラスのリクエストに使うモデル。
`CLAUDE_CODE_SUBAGENT_MODEL`	Claude Code の subagent に使うモデル。

モデルの選び方

上のモデル ID は単なる割り当てだ。Claude Code の各スロットを別々の Token Station モデルに向けてもよいし、すべて同じモデルにしてもよい。実用的な初期値は、Opus に強いモデルを置き、Sonnet、Haiku、subagent にはより速く安いモデルを置くことだ。

Token Station での出発点として使いやすいモデル：

Claude Code スロット	Token Station モデル	使う理由
`Opus`	`openai/gpt-5.5`	難しい設計、デバッグ、アーキテクチャ、長い編集の強い既定値。
`Sonnet`	`openai/gpt-5.4-mini`	日常的なコーディング、レビュー、リポジトリ調査、リファクタリング向けのバランス型。
`Haiku`	`openai/gpt-5.4-nano`	短いプロンプト、素早い確認、低コスト・低レイテンシのタスク向け。
`Subagent`	`openai/gpt-5.4-mini`	委任された調査に十分強く、すべてのサブタスクをフラッグシップ価格にしない。
`Alternative Opus`	`anthropic/claude-opus-4-8`	長期的なコーディングで Claude 系の挙動を明確に使いたいとき。
`Budget coding`	`kimi/kimi-k2.7-code`	最大の推論深度よりコストを重視する定型的な実装作業に向く。

これらの model ID は、上の対応する ANTHROPIC_DEFAULT_* 変数にそのまま入れられる。まずは設定ブロックのバランス型の割り当てから始め、タスクが本当に必要とするときだけ Opus を上げる、または Haiku をさらに安いモデルへ下げるとよい。

うまくつながらないとき

まだ既定の Anthropic エンドポイントを使う。ANTHROPIC_BASE_URL が claude を起動する shell にあるか、または ~/.claude/settings.json に入っているか確認する。
401 / 認証エラー。YOUR TOKEN AT TOKEN STATION を実際の Token Station キーに置き換える。
違うモデルが応答する。Opus、Sonnet、Haiku、subagent のモデル変数を確認する。Claude Code はリクエスト種別に応じてこれらのスロットを選ぶ。
settings ファイルが効かない。~/.claude/settings.json が正しい JSON であることを確認し、編集後に Claude Code コマンドを実行し直す。

はじめよう

恒久的に使うなら ~/.claude/settings.json。一時的に使うなら現在の shell で変数を export する。どちらの場合も確認方法は同じで、claude -p "Respond with exactly the word: pong" を実行し、pong が返るかを見る。

models.bytefuture.ai で登録し（無料クレジット 1 ドル、カード不要、初回チャージで最大 50 ドルのボーナス）、Token Station キーを Claude Code に入れ、Claude Code の各モデルスロットを実際に使いたいモデルへ向けよう。