在 Claude Code 中通过 Token Station 使用任意模型

Claude Code 可以不通过额外代理，直接连到 Token Station。把 Claude Code 的请求地址指向 https://models.bytefuture.ai，把 Token Station 的 key 当作 Anthropic auth token，再分别指定 Opus、Sonnet、Haiku 和 subagent 请求由哪些 Token Station 模型来回答。

有两种干净的配置方式。想长期生效，就写入 ~/.claude/settings.json。只想临时试一次、跑 CI、或者切一个测试会话，就用 shell 里的环境变量。

方式一：持久化 settings.json

先创建 Claude Code 的配置目录，然后把环境变量块写入 ~/.claude/settings.json：

mkdir -p ~/.claude
cat > ~/.claude/settings.json <<'EOF'
{
  "env": {
    "ANTHROPIC_BASE_URL": "https://models.bytefuture.ai",
    "ANTHROPIC_AUTH_TOKEN": "YOUR TOKEN AT TOKEN STATION",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "openai/gpt-5.5",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "openai/gpt-5.4-mini",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "openai/gpt-5.4-nano",
    "CLAUDE_CODE_SUBAGENT_MODEL": "openai/gpt-5.4-mini"
  }
}
EOF

然后用一个最小 prompt 验证 CLI 是否已经在走 Token Station：

claude -p "Respond with exactly the word: pong"

如果输出正好是 pong，说明 Claude Code 已经连上 Token Station，并且由你配置的模型返回了结果。

方式二：临时 export 环境变量

如果不想写配置文件，可以在启动 Claude Code 的同一个 shell 里导出同样的值：

export ANTHROPIC_BASE_URL="https://models.bytefuture.ai"
export ANTHROPIC_AUTH_TOKEN="YOUR TOKEN AT TOKEN STATION"

export ANTHROPIC_DEFAULT_OPUS_MODEL="openai/gpt-5.5"
export ANTHROPIC_DEFAULT_SONNET_MODEL="openai/gpt-5.4-mini"
export ANTHROPIC_DEFAULT_HAIKU_MODEL="openai/gpt-5.4-nano"
export CLAUDE_CODE_SUBAGENT_MODEL="openai/gpt-5.4-mini"

claude -p "Respond with exactly the word: pong"

这适合临时测试一组新的模型映射，而不改你已经保存的 Claude Code 配置。

每个变量的含义

变量	含义
`ANTHROPIC_BASE_URL`	Claude Code 发送请求的 API 地址。Token Station 使用 `https://models.bytefuture.ai`。
`ANTHROPIC_AUTH_TOKEN`	你的 Token Station API key。不要把它提交到代码仓库。
`ANTHROPIC_DEFAULT_OPUS_MODEL`	Claude Code 处理 Opus 档请求时使用的模型。
`ANTHROPIC_DEFAULT_SONNET_MODEL`	Claude Code 处理 Sonnet 档请求时使用的模型。
`ANTHROPIC_DEFAULT_HAIKU_MODEL`	Claude Code 处理 Haiku 档请求时使用的模型。
`CLAUDE_CODE_SUBAGENT_MODEL`	Claude Code 给 subagent 使用的模型。

怎么选模型

上面的模型 ID 只是一个映射。你可以给 Claude Code 的每个档位分配不同的 Token Station 模型，也可以全部指向同一个模型。实用的默认方案是：Opus 给强模型，Sonnet、Haiku 和 subagent 给更快、更便宜的模型。

几个适合作为起点的 Token Station 模型：

Claude Code 档位	Token Station 模型	为什么用它
`Opus`	`openai/gpt-5.5`	复杂规划、调试、架构设计和长编辑的默认强模型。
`Sonnet`	`openai/gpt-5.4-mini`	适合作为日常编码、代码审查、仓库导航和重构的均衡主力。
`Haiku`	`openai/gpt-5.4-nano`	适合短 prompt、快速检查、低成本和低延迟任务。
`Subagent`	`openai/gpt-5.4-mini`	足够处理委派调查，又不会让每个子任务都按旗舰模型计价。
`Alternative Opus`	`anthropic/claude-opus-4-8`	当你明确想要 Claude 系模型处理长链路编码时使用。
`Budget coding`	`kimi/kimi-k2.7-code`	适合常规实现工作，尤其是成本比最高推理深度更重要时。

这些 model ID 都可以复制到上面对应的 ANTHROPIC_DEFAULT_* 变量里。先用配置块里的均衡映射开始，只有任务真的需要时，再把 Opus 往上调，或把 Haiku 往更便宜的模型调。

如果连不上

还是走默认 Anthropic endpoint。确认 ANTHROPIC_BASE_URL 出现在启动 claude 的 shell 里，或者已经写进 ~/.claude/settings.json。
401 / 鉴权错误。把 YOUR TOKEN AT TOKEN STATION 换成真实的 Token Station key。
回答的模型不对。检查 Opus、Sonnet、Haiku 和 subagent 的模型变量。Claude Code 会根据请求类型在这些档位之间选择。
settings 文件看起来没生效。确认 ~/.claude/settings.json 是合法 JSON，并在修改后重新运行 Claude Code 命令。

开始上手

想长期使用，就写 ~/.claude/settings.json。想临时使用，就在当前 shell 里 export 这些变量。两种方式的验证命令都一样：运行 claude -p "Respond with exactly the word: pong"，看它是否返回 pong。

到 models.bytefuture.ai 注册（1 美元免费额度，无需信用卡；首次充值最高再送 50 美元），把 Token Station key 放进 Claude Code，再把 Claude Code 的各个模型档位指向你真正想用的模型。