教程

在 Claude Code 中通过 Token Station 使用任意模型

Claude Code 可以不通过额外代理,直接连到 Token Station。把 Claude Code 的请求地址指向 https://models.bytefuture.ai,把 Token Station 的 key 当作 Anthropic auth token,再分别指定 Opus、Sonnet、Haiku 和 subagent 请求由哪些 Token Station 模型来回答。

有两种干净的配置方式。想长期生效,就写入 ~/.claude/settings.json。只想临时试一次、跑 CI、或者切一个测试会话,就用 shell 里的环境变量。

方式一:持久化 settings.json

先创建 Claude Code 的配置目录,然后把环境变量块写入 ~/.claude/settings.json

mkdir -p ~/.claude
cat > ~/.claude/settings.json <<'EOF'
{
  "env": {
    "ANTHROPIC_BASE_URL": "https://models.bytefuture.ai",
    "ANTHROPIC_AUTH_TOKEN": "YOUR TOKEN AT TOKEN STATION",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "openai/gpt-5.5",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "openai/gpt-5.4-mini",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "openai/gpt-5.4-nano",
    "CLAUDE_CODE_SUBAGENT_MODEL": "openai/gpt-5.4-mini"
  }
}
EOF

然后用一个最小 prompt 验证 CLI 是否已经在走 Token Station

claude -p "Respond with exactly the word: pong"

如果输出正好是 pong,说明 Claude Code 已经连上 Token Station,并且由你配置的模型返回了结果。

方式二:临时 export 环境变量

如果不想写配置文件,可以在启动 Claude Code 的同一个 shell 里导出同样的值:

export ANTHROPIC_BASE_URL="https://models.bytefuture.ai"
export ANTHROPIC_AUTH_TOKEN="YOUR TOKEN AT TOKEN STATION"

export ANTHROPIC_DEFAULT_OPUS_MODEL="openai/gpt-5.5"
export ANTHROPIC_DEFAULT_SONNET_MODEL="openai/gpt-5.4-mini"
export ANTHROPIC_DEFAULT_HAIKU_MODEL="openai/gpt-5.4-nano"
export CLAUDE_CODE_SUBAGENT_MODEL="openai/gpt-5.4-mini"

claude -p "Respond with exactly the word: pong"

这适合临时测试一组新的模型映射,而不改你已经保存的 Claude Code 配置。

每个变量的含义

变量含义
ANTHROPIC_BASE_URLClaude Code 发送请求的 API 地址。Token Station 使用 https://models.bytefuture.ai
ANTHROPIC_AUTH_TOKEN你的 Token Station API key。不要把它提交到代码仓库。
ANTHROPIC_DEFAULT_OPUS_MODELClaude Code 处理 Opus 档请求时使用的模型。
ANTHROPIC_DEFAULT_SONNET_MODELClaude Code 处理 Sonnet 档请求时使用的模型。
ANTHROPIC_DEFAULT_HAIKU_MODELClaude Code 处理 Haiku 档请求时使用的模型。
CLAUDE_CODE_SUBAGENT_MODELClaude Code 给 subagent 使用的模型。

怎么选模型

上面的模型 ID 只是一个映射。你可以给 Claude Code 的每个档位分配不同的 Token Station 模型,也可以全部指向同一个模型。实用的默认方案是:Opus 给强模型,Sonnet、Haiku 和 subagent 给更快、更便宜的模型。

几个适合作为起点的 Token Station 模型:

Claude Code 档位Token Station 模型为什么用它
Opusopenai/gpt-5.5复杂规划、调试、架构设计和长编辑的默认强模型。
Sonnetopenai/gpt-5.4-mini适合作为日常编码、代码审查、仓库导航和重构的均衡主力。
Haikuopenai/gpt-5.4-nano适合短 prompt、快速检查、低成本和低延迟任务。
Subagentopenai/gpt-5.4-mini足够处理委派调查,又不会让每个子任务都按旗舰模型计价。
Alternative Opusanthropic/claude-opus-4-8当你明确想要 Claude 系模型处理长链路编码时使用。
Budget codingkimi/kimi-k2.7-code适合常规实现工作,尤其是成本比最高推理深度更重要时。

这些 model ID 都可以复制到上面对应的 ANTHROPIC_DEFAULT_* 变量里。先用配置块里的均衡映射开始,只有任务真的需要时,再把 Opus 往上调,或把 Haiku 往更便宜的模型调。

如果连不上

  • 还是走默认 Anthropic endpoint。确认 ANTHROPIC_BASE_URL 出现在启动 claude 的 shell 里,或者已经写进 ~/.claude/settings.json
  • 401 / 鉴权错误。YOUR TOKEN AT TOKEN STATION 换成真实的 Token Station key。
  • 回答的模型不对。检查 Opus、Sonnet、Haiku 和 subagent 的模型变量。Claude Code 会根据请求类型在这些档位之间选择。
  • settings 文件看起来没生效。确认 ~/.claude/settings.json 是合法 JSON,并在修改后重新运行 Claude Code 命令。

开始上手

想长期使用,就写 ~/.claude/settings.json。想临时使用,就在当前 shell 里 export 这些变量。两种方式的验证命令都一样:运行 claude -p "Respond with exactly the word: pong",看它是否返回 pong

models.bytefuture.ai 注册(10 美元免费额度,无需信用卡),把 Token Station key 放进 Claude Code,再把 Claude Code 的各个模型档位指向你真正想用的模型。


分享这篇文章 Post LinkedIn Facebook Hacker News Reddit