Blog
ClaudeFable 5AnthropicLLMAI

Claude Fable 5는 무엇이 다른가 — 기존 모델과의 차이 정리

Anthropic의 최상위 공개 모델 Claude Fable 5가 Opus·Sonnet·Haiku 및 이전 모델과 어떻게 다른지 정리합니다. 모델 사양과 가격, 항상 켜진 thinking·protected thinking·새 토크나이저·refusal 같은 API 동작 차이, 그리고 롱호라이즌 에이전트 역량과 프롬프트·운영 방식의 변화를 다룹니다.

Data Dynamics2026年6月12日12 min read
This post is not yet translated. The original Korean version is shown below.

Anthropic이 현재 공개한 가장 강력한 모델은 Claude Fable 5(claude-fable-5)입니다. Opus 4.8 위에 또 하나의 티어가 생긴 셈인데, 단순히 "더 똑똑한 모델" 이상으로 API 동작과 운영 방식 자체가 달라진 부분이 많습니다. 이 글은 Fable 5가 Opus·Sonnet·Haiku 및 이전 모델과 구체적으로 무엇이 다른지를 개발자 관점에서 정리합니다.

본문의 모델 ID·가격·동작은 Anthropic 공식 API 레퍼런스 기준입니다.

1. Fable 5 개요와 포지셔닝

Fable 5는 가장 까다로운 추론과 롱호라이즌(long-horizon) 에이전트 작업을 위한 모델입니다. 핵심 사양은 다음과 같습니다.

  • 모델 ID: claude-fable-5
  • 컨텍스트 윈도우: 1M 토큰(최대치가 곧 기본값)
  • 최대 출력: 128K 토큰
  • 가격: 입력 $10 / 출력 $50 (per 1M tokens)

중요한 포지셔닝 포인트: Fable 5는 "최신 모델로 업그레이드"의 기본 경로가 아닙니다. 가격이 Opus-tier를 상회하고 토크나이저가 바뀌어 비용 베이스라인이 달라지기 때문에, 일반적인 Opus 업그레이드의 권장 대상은 여전히 claude-opus-4-8입니다. Fable 5는 그 위의 난도가 필요할 때 명시적으로 선택하는 모델입니다.

참고: Claude Mythos 5(claude-mythos-5)는 Fable 5와 동일한 역량·가격·API를 Project Glasswing을 통해 제공하는 모델입니다. 아래 내용은 두 모델 모두에 적용됩니다.

2. 라인업 비교

모델모델 ID컨텍스트최대 출력입력 $/1M출력 $/1M
Claude Fable 5claude-fable-51M128K$10$50
Claude Opus 4.8claude-opus-4-81M128K$5$25
Claude Sonnet 4.6claude-sonnet-4-61M64K$3$15
Claude Haiku 4.5claude-haiku-4-5200K64K$1$5

같은 1M 컨텍스트라도 Fable 5는 가장 높은 지능 상한가장 높은 단가를 가집니다. 속도·비용 효율이 중요하면 Sonnet, 단순·대량 작업이면 Haiku가 여전히 합리적입니다.

3. API 동작의 핵심 차이 (개발자 관점)

코드를 옮길 때 가장 먼저 체감하는 차이는 모델 지능이 아니라 요청/응답 규약입니다.

Thinking이 항상 켜져 있음

Fable 5는 thinking이 항상 켜져 있습니다. thinking 파라미터를 아예 생략하면 적응형(adaptive) thinking이 적용됩니다. 다른 설정은 거부됩니다 — thinking: {type: "disabled"}thinking: {type: "enabled", budget_tokens: N}둘 다 400 에러입니다. 사고 깊이는 budget_tokens가 아니라 output_config.effort(low부터 xhigh·max까지)로 제어합니다.

# Fable 5 — thinking 파라미터 없음, effort로 깊이 제어
client.messages.create(
    model="claude-fable-5",
    max_tokens=16000,
    output_config={"effort": "high"},   # low | medium | high | xhigh | max
    messages=[...],
)

Protected thinking — raw 추론은 노출되지 않음

응답에는 일반 thinking 블록이 들어오지만, 원시 사고 과정(raw chain of thought)은 어떤 설정에서도 노출되지 않습니다. display: "summarized"는 읽기 좋은 요약을, "omitted"(기본값)는 빈 thinking 필드를 돌려줍니다. 멀티턴으로 이어갈 때는 같은 모델에서는 thinking 블록을 받은 그대로 되돌려줘야 합니다(수정하면 거부). 다른 모델로 넘기면 해당 블록은 프롬프트에서 조용히 제거되며, 제거분은 과금되지 않습니다.

새 토크나이저 — 토큰·비용 재산정 필요

Fable 5는 새 토크나이저를 씁니다. 같은 콘텐츠가 Opus-tier 대비 약 30% 더 많은 토큰으로 계산됩니다. 과금은 토큰 단위이므로, 단가 차이를 빼고도 동일 워크로드의 비용이 올라갈 수 있습니다. Opus·Sonnet에서 측정한 토큰 수·max_tokens·컨텍스트 예산을 그대로 재사용하지 말고 다시 측정하세요.

# count_tokens는 두 토크나이저 기준 값을 함께 반환
resp = client.messages.count_tokens(model="claude-fable-5", messages=[...])
resp.input_tokens                  # 새 토크나이저 (실제 과금)
resp.input_tokens_prior_tokenizer  # 이전 세대 토크나이저 기준

refusal stop reason

Fable 5는 들어오는 요청에 안전 분류기를 돌립니다(연구용 생물학과 대부분의 사이버 보안 영역 대상). 분류기가 거절하면 HTTP 200stop_reason: "refusal"로 응답합니다. 출력 전 거절이면 content가 비어 있고 과금되지 않으며, 스트리밍 도중 거절이면 이미 나간 부분은 과금되니 버려야 합니다. content를 읽기 전에 stop_reason을 먼저 확인해야 합니다.

response = client.messages.create(model="claude-fable-5", max_tokens=1024, messages=[...])
if response.stop_reason == "refusal":
    handle_refusal()          # content가 비었거나 부분 출력 — 폐기
else:
    print(response.content[0].text)

다른 모델로 재시도하려면 서버측 fallbacks 파라미터(베타)나 SDK의 fallback 미들웨어를 쓰면 한 번에 처리됩니다.

그 밖의 규약 차이

  • assistant prefill 미지원 — 마지막 assistant 턴 프리필은 400. 출력 형식 강제는 output_config.format(구조화 출력)이나 시스템 프롬프트로 대체합니다(4.6+ 계열과 동일).
  • 30일 데이터 보존 필수 — Fable 5는 ZDR(zero data retention)에서 사용할 수 없습니다. 보존 설정이 요건에 못 미치면 모든 요청이 400입니다. 페이로드에 문제가 없는데 400이 나면 조직의 데이터 보존 설정부터 확인하세요.

4. 역량 차이 — 무엇을 더 잘하나

Fable 5의 강점은 이전 모델이 해내지 못하던 난도에서 두드러집니다.

  • 롱호라이즌 자율 실행 — 복잡한 리팩터링이나 야간 코딩 런처럼, 사람의 개입 없이 길게 이어지는 에이전트 작업에서 state-of-the-art입니다. 어려운 작업의 단일 요청이 수 분 단위로 실행되는 것이 정상입니다.
  • effort가 더 중요해짐 — Fable 5에서는 낮은 effort도 매우 좋은 성능을 냅니다. low조차 이전 모델의 xhigh·max 성능을 넘는 경우가 흔합니다. 작업이 맞게 끝나는데 시간이 오래 걸린다면 effort를 낮추는 것이 첫 번째 조정입니다.
  • 고해상도 비전 — 뒤집히거나 흐릿하거나 노이즈가 낀 이미지에서도 bash·crop 도구를 적극 활용하도록 학습되어 있습니다.
  • 비동기 서브에이전트 협업 — 장기 실행 서브에이전트와의 지속적 통신을 안정적으로 유지합니다. 위임을 억제하기보다 적극 활용하는 편이 유리합니다.
  • 파일 기반 메모리 활용 — 학습한 내용을 파일에 적어두고 이후 세션에서 참조하게 하면 성능이 눈에 띄게 좋아집니다.
  • 코드 리뷰·디버깅 — 실제 버그를 더 잘 찾고 더 명확히 설명합니다(단, 보안 중심 분석은 위 안전 분류기 영향으로 제외).

5. 프롬프트·운영 방식의 변화

Fable 5는 코드 규약뿐 아니라 프롬프트와 운영 패턴도 다시 보게 만듭니다.

  • 긴 턴을 전제로 설계 — 단일 요청이 수 분을 넘길 수 있으니 타임아웃·스트리밍·진행 상황 UX를 미리 준비하고, 동기 요청 안에서 블로킹하기보다 비동기로 체크인하도록 구성하세요.
  • 과도하게 prescriptive한 프롬프트는 오히려 품질을 떨어뜨림 — 이전 모델용으로 단계를 일일이 지시하던 프롬프트·스킬은 Fable 5에서 출력 품질을 낮출 수 있습니다. 단계 나열을 빼고 목표와 제약 중심으로 다시 쓴 뒤 A/B로 비교하세요.
  • effort 스윕에 low/medium 포함 — 루틴 작업은 낮은 effort로 충분히, 때로는 더 낫게 처리됩니다.
  • 불필요한 정리·오버엔지니어링 억제 — 높은 effort에서는 요청 범위를 넘는 리팩터링·추상화를 덧붙일 수 있습니다. "요청한 것만, 가장 단순하게"를 시스템 프롬프트에 명시하면 효과적입니다.

6. 언제 Fable 5, 언제 Opus 4.8로 충분한가

상황권장
일반적인 "최신 Opus로 업그레이드"Opus 4.8 (claude-opus-4-8)
비용·속도 균형이 중요한 대량 워크로드Sonnet 4.6 / Haiku 4.5
사람 개입 없이 길게 도는 자율 에이전트, 최고난도 추론·기획·구현Fable 5
ZDR(무보존)이 필수인 조직Fable 5 불가 → Opus-tier

즉 Fable 5는 **"이전 모델로는 안 되던 일"**을 명시적으로 노릴 때 켜는 모델입니다. 그 외에는 Opus 4.8이 더 단순하고 저렴한 선택입니다.

마무리

Fable 5의 차이는 세 층으로 요약됩니다. (1) 사양·가격 — 1M 컨텍스트·128K 출력에 Opus-tier를 넘는 단가, (2) API 규약 — 항상 켜진 thinking, protected thinking, 새 토크나이저, refusal, prefill 미지원, 30일 보존, (3) 역량·운영 — 분 단위 롱호라이즌 자율 실행과 "덜 지시할수록 좋은" 프롬프트 방식. 도입을 검토한다면, 가장 어려운 작업 하나를 골라 effort를 스윕해 보는 것에서 시작하길 권합니다.