Claude Code는 별도 래퍼나 프록시 없이 Token Station에 연결할 수 있다. Claude Code의 요청 주소를 https://models.bytefuture.ai로 향하게 하고, Token Station 키를 Anthropic auth token으로 사용한 뒤, Opus, Sonnet, Haiku, subagent 요청에 어떤 Token Station 모델을 쓸지 지정하면 된다.
방법은 두 가지다. 셸을 넘어 계속 유지하려면 ~/.claude/settings.json을 사용한다. 임시 세션, CI 작업, 한 번만 하는 테스트라면 환경 변수를 export하면 된다.
방법 1: 영구 settings.json
Claude Code 설정 디렉터리를 만들고 ~/.claude/settings.json에 환경 변수 블록을 쓴다:
mkdir -p ~/.claude
cat > ~/.claude/settings.json <<'EOF'
{
"env": {
"ANTHROPIC_BASE_URL": "https://models.bytefuture.ai",
"ANTHROPIC_AUTH_TOKEN": "YOUR TOKEN AT TOKEN STATION",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "openai/gpt-5.5",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "openai/gpt-5.4-mini",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "openai/gpt-5.4-nano",
"CLAUDE_CODE_SUBAGENT_MODEL": "openai/gpt-5.4-mini"
}
}
EOF
그런 다음 최소 프롬프트로 CLI가 Token Station을 쓰는지 확인한다:
claude -p "Respond with exactly the word: pong"
출력이 정확히 pong이면 Claude Code가 Token Station에 도달했고, 설정한 모델이 응답하고 있는 것이다.
방법 2: 임시 shell export
설정 파일을 쓰고 싶지 않다면, Claude Code를 실행할 같은 shell에서 같은 값을 export한다:
export ANTHROPIC_BASE_URL="https://models.bytefuture.ai"
export ANTHROPIC_AUTH_TOKEN="YOUR TOKEN AT TOKEN STATION"
export ANTHROPIC_DEFAULT_OPUS_MODEL="openai/gpt-5.5"
export ANTHROPIC_DEFAULT_SONNET_MODEL="openai/gpt-5.4-mini"
export ANTHROPIC_DEFAULT_HAIKU_MODEL="openai/gpt-5.4-nano"
export CLAUDE_CODE_SUBAGENT_MODEL="openai/gpt-5.4-mini"
claude -p "Respond with exactly the word: pong"
저장된 Claude Code 설정을 바꾸지 않고 다른 모델 매핑을 시험할 때 유용하다.
각 변수의 의미
| 변수 | 의미 |
|---|---|
ANTHROPIC_BASE_URL | Claude Code가 요청을 보내는 API 엔드포인트. Token Station에서는 https://models.bytefuture.ai를 사용한다. |
ANTHROPIC_AUTH_TOKEN | Token Station API 키. 소스 관리에 넣지 않는다. |
ANTHROPIC_DEFAULT_OPUS_MODEL | Opus급 요청에 Claude Code가 사용할 모델. |
ANTHROPIC_DEFAULT_SONNET_MODEL | Sonnet급 요청에 Claude Code가 사용할 모델. |
ANTHROPIC_DEFAULT_HAIKU_MODEL | Haiku급 요청에 Claude Code가 사용할 모델. |
CLAUDE_CODE_SUBAGENT_MODEL | Claude Code subagent가 사용할 모델. |
모델 고르기
위의 모델 ID는 단순한 매핑이다. Claude Code의 각 슬롯을 서로 다른 Token Station 모델로 향하게 할 수도 있고, 모두 같은 모델로 둘 수도 있다. 실용적인 기본값은 Opus에는 강한 모델을, Sonnet, Haiku, subagent에는 더 빠르고 저렴한 모델을 두는 것이다.
Token Station에서 시작점으로 쓰기 좋은 모델:
| Claude Code 슬롯 | Token Station 모델 | 쓰는 이유 |
|---|---|---|
Opus | openai/gpt-5.5 | 어려운 계획, 디버깅, 아키텍처, 긴 편집에 적합한 강한 기본값. |
Sonnet | openai/gpt-5.4-mini | 일상 코딩, 리뷰, 저장소 탐색, 리팩터링에 알맞은 균형형 주력 모델. |
Haiku | openai/gpt-5.4-nano | 짧은 프롬프트, 빠른 확인, 저비용·저지연 작업에 적합. |
Subagent | openai/gpt-5.4-mini | 위임된 조사를 처리하기에 충분하면서 모든 하위 작업을 플래그십 가격으로 만들지 않는다. |
Alternative Opus | anthropic/claude-opus-4-8 | 장기 코딩에서 Claude 계열의 동작을 명확히 원할 때 사용. |
Budget coding | kimi/kimi-k2.7-code | 최대 추론 깊이보다 비용이 더 중요한 일반 구현 작업에 적합. |
이 model ID들은 위의 해당 ANTHROPIC_DEFAULT_* 변수에 그대로 넣을 수 있다. 먼저 설정 블록의 균형 잡힌 매핑으로 시작하고, 작업이 정말 요구할 때만 Opus를 올리거나 Haiku를 더 저렴한 모델로 낮추면 된다.
연결이 안 될 때
- 여전히 기본 Anthropic 엔드포인트를 쓴다.
ANTHROPIC_BASE_URL이claude를 실행하는 shell에 있거나~/.claude/settings.json안에 있는지 확인하라. - 401 / 인증 오류.
YOUR TOKEN AT TOKEN STATION을 실제 Token Station 키로 바꿔라. - 다른 모델이 응답한다. Opus, Sonnet, Haiku, subagent 모델 변수를 확인하라. Claude Code는 요청 유형에 따라 이 슬롯들 중 하나를 선택한다.
- settings 파일이 적용되지 않는 것 같다.
~/.claude/settings.json이 올바른 JSON인지 확인하고, 수정 후 Claude Code 명령을 다시 실행하라.
시작하기
영구 설정에는 ~/.claude/settings.json을 쓰고, 임시 설정에는 현재 shell에서 변수를 export하면 된다. 두 경우 모두 확인 방법은 같다. claude -p "Respond with exactly the word: pong"을 실행하고 pong이 돌아오는지 보면 된다.
models.bytefuture.ai에서 가입하고($10 무료 크레딧, 카드 불필요), Token Station 키를 Claude Code에 넣은 뒤 Claude Code의 모델 슬롯들을 실제로 쓰고 싶은 모델에 연결하라.