ClaudeFable 5AnthropicLLMAI

Claude Fable 5는 무엇이 다른가 — 기존 모델과의 차이 정리

Anthropic의 최상위 공개 모델 Claude Fable 5가 Opus·Sonnet·Haiku 및 이전 모델과 어떻게 다른지 정리합니다. 모델 사양과 가격, 항상 켜진 thinking·protected thinking·새 토크나이저·refusal 같은 API 동작 차이, 그리고 롱호라이즌 에이전트 역량과 프롬프트·운영 방식의 변화를 다룹니다.

Data Dynamics2026年6月12日16 min read

This post is not yet translated. The original Korean version is shown below.

새 스마트폰이 나왔을 때 "이번엔 그냥 카메라만 좋아진 거 아니야?"라고 생각했다가 충전 방식이 완전히 바뀌어 놀란 적 있으신가요? Claude Fable 5(claude-fable-5)가 딱 그런 모델입니다. Opus 4.8 위에 하나의 티어가 생긴 것은 맞지만, 단순히 "더 똑똑한 모델"로 바꿔 끼우면 되는 게 아닙니다. API 동작과 운영 방식 자체가 달라진 부분이 많아, 기존 코드를 그대로 가져가면 예상치 못한 곳에서 막힙니다.

이 글에서 배우는 것

Fable 5의 포지셔닝과 사양 — 언제 쓰고 언제 쓰지 말아야 하는지

thinking·protected thinking·새 토크나이저·refusal 등 API 규약이 어떻게 달라졌는지

역량 차이 — 무엇을 더 잘하고 어디에 적합한지

프롬프트·운영 방식을 어떻게 바꿔야 하는지

본문의 모델 ID·가격·동작은 Anthropic 공식 API 레퍼런스 기준입니다.

1. Fable 5 개요와 포지셔닝

Fable 5는 가장 까다로운 추론과 롱호라이즌(long-horizon) 에이전트 작업을 위한 모델입니다. "가장 강력한 모델 = 가장 기본적인 업그레이드 경로"가 아니라는 점이 핵심인데, 먼저 사양부터 보겠습니다.

모델 ID: claude-fable-5
컨텍스트 윈도우: 1M 토큰(최대치가 곧 기본값)
최대 출력: 128K 토큰
가격: 입력 $10 / 출력 $50 (per 1M tokens)

중요한 포지셔닝 포인트를 하나 짚고 넘어가겠습니다. Fable 5는 "최신 모델로 업그레이드"의 기본 경로가 아닙니다. 가격이 Opus-tier를 상회하고 토크나이저가 바뀌어 비용 베이스라인이 달라지기 때문입니다. 일반적인 Opus 업그레이드의 권장 대상은 여전히 claude-opus-4-8입니다. Fable 5는 그 위의 난도가 필요할 때 명시적으로 선택하는 모델입니다.

한 문장으로: Fable 5는 "이전 모델로는 안 되던 일"을 명시적으로 노릴 때 선택하는 모델입니다.

참고: Claude Mythos 5(claude-mythos-5)는 Fable 5와 동일한 역량·가격·API를 Project Glasswing을 통해 제공하는 모델입니다. 아래 내용은 두 모델 모두에 적용됩니다.

2. 라인업 비교

전체 라인업을 한눈에 비교하면 어느 모델을 골라야 할지 훨씬 명확해집니다.

모델	모델 ID	컨텍스트	최대 출력	입력 $/1M	출력 $/1M
Claude Fable 5	`claude-fable-5`	1M	128K	$10	$50
Claude Opus 4.8	`claude-opus-4-8`	1M	128K	$5	$25
Claude Sonnet 4.6	`claude-sonnet-4-6`	1M	64K	$3	$15
Claude Haiku 4.5	`claude-haiku-4-5`	200K	64K	$1	$5

같은 1M 컨텍스트라도 Fable 5는 가장 높은 지능 상한과 가장 높은 단가를 가집니다. 속도·비용 효율이 중요하면 Sonnet, 단순·대량 작업이면 Haiku가 여전히 합리적입니다.

3. API 동작의 핵심 차이 (개발자 관점)

기존 Opus 코드를 Fable 5로 옮기려다 처음 맞닥뜨리는 장벽은 모델 지능이 아닙니다. 요청/응답 규약 자체가 달라졌기 때문입니다. 하나씩 살펴보죠.

Thinking이 항상 켜져 있음

이전 모델에서는 thinking을 켜고 끄는 것이 선택이었습니다. 하지만 Fable 5에서는 thinking이 항상 켜져 있습니다. thinking 파라미터를 아예 생략하면 적응형(adaptive) thinking이 적용됩니다. 다른 설정은 거부됩니다 — thinking: {type: "disabled"} 와 thinking: {type: "enabled", budget_tokens: N} 는 둘 다 400 에러입니다. 사고 깊이는 budget_tokens가 아니라 output_config.effort(low부터 xhigh·max까지)로 제어합니다.

# Fable 5 — thinking 파라미터 없음, effort로 깊이 제어
client.messages.create(
    model="claude-fable-5",
    max_tokens=16000,
    output_config={"effort": "high"},   # low | medium | high | xhigh | max
    messages=[...],
)

Protected thinking — raw 추론은 노출되지 않음

"모델의 생각 과정을 다 들여다볼 수 있지 않을까?"라고 기대하셨다면, Fable 5에서는 그렇지 않습니다. 응답에는 일반 thinking 블록이 들어오지만, 원시 사고 과정(raw chain of thought)은 어떤 설정에서도 노출되지 않습니다. display: "summarized"는 읽기 좋은 요약을, "omitted"(기본값)는 빈 thinking 필드를 돌려줍니다. 멀티턴으로 이어갈 때는 같은 모델에서는 thinking 블록을 받은 그대로 되돌려줘야 합니다(수정하면 거부). 다른 모델로 넘기면 해당 블록은 프롬프트에서 조용히 제거되며, 제거분은 과금되지 않습니다.

새 토크나이저 — 토큰·비용 재산정 필요

비용 계획을 세울 때 주의할 부분이 있습니다. Fable 5는 새 토크나이저를 씁니다. 같은 콘텐츠가 Opus-tier 대비 약 30% 더 많은 토큰으로 계산됩니다. 과금은 토큰 단위이므로, 단가 차이를 빼고도 동일 워크로드의 비용이 올라갈 수 있습니다. Opus·Sonnet에서 측정한 토큰 수·max_tokens·컨텍스트 예산을 그대로 재사용하지 말고 다시 측정하세요.

# count_tokens는 두 토크나이저 기준 값을 함께 반환
resp = client.messages.count_tokens(model="claude-fable-5", messages=[...])
resp.input_tokens                  # 새 토크나이저 (실제 과금)
resp.input_tokens_prior_tokenizer  # 이전 세대 토크나이저 기준

`refusal` stop reason

이전 모델에서는 없던 새 stop reason입니다. Fable 5는 들어오는 요청에 안전 분류기를 돌립니다(연구용 생물학과 대부분의 사이버 보안 영역 대상). 분류기가 거절하면 HTTP 200에 stop_reason: "refusal"로 응답합니다. 출력 전 거절이면 content가 비어 있고 과금되지 않으며, 스트리밍 도중 거절이면 이미 나간 부분은 과금되니 버려야 합니다. content를 읽기 전에 stop_reason을 먼저 확인해야 합니다.

response = client.messages.create(model="claude-fable-5", max_tokens=1024, messages=[...])
if response.stop_reason == "refusal":
    handle_refusal()          # content가 비었거나 부분 출력 — 폐기
else:
    print(response.content[0].text)

다른 모델로 재시도하려면 서버측 fallbacks 파라미터(베타)나 SDK의 fallback 미들웨어를 쓰면 한 번에 처리됩니다.

그 밖의 규약 차이

assistant prefill 미지원 — 마지막 assistant 턴 프리필은 400. 출력 형식 강제는 output_config.format(구조화 출력)이나 시스템 프롬프트로 대체합니다(4.6+ 계열과 동일).
30일 데이터 보존 필수 — Fable 5는 ZDR(zero data retention)에서 사용할 수 없습니다. 보존 설정이 요건에 못 미치면 모든 요청이 400입니다. 페이로드에 문제가 없는데 400이 나면 조직의 데이터 보존 설정부터 확인하세요.

4. 역량 차이 — 무엇을 더 잘하나

규약이 달라진 이유가 있습니다. Fable 5의 강점은 이전 모델이 해내지 못하던 난도에서 두드러집니다. 어떤 작업에서 실제 차이가 나는지 살펴봅시다.

롱호라이즌 자율 실행 — 복잡한 리팩터링이나 야간 코딩 런처럼, 사람의 개입 없이 길게 이어지는 에이전트 작업에서 state-of-the-art입니다. 어려운 작업의 단일 요청이 수 분 단위로 실행되는 것이 정상입니다.
effort가 더 중요해짐 — Fable 5에서는 낮은 effort도 매우 좋은 성능을 냅니다. low조차 이전 모델의 xhigh·max 성능을 넘는 경우가 흔합니다. 작업이 맞게 끝나는데 시간이 오래 걸린다면 effort를 낮추는 것이 첫 번째 조정입니다.
고해상도 비전 — 뒤집히거나 흐릿하거나 노이즈가 낀 이미지에서도 bash·crop 도구를 적극 활용하도록 학습되어 있습니다.
비동기 서브에이전트 협업 — 장기 실행 서브에이전트와의 지속적 통신을 안정적으로 유지합니다. 위임을 억제하기보다 적극 활용하는 편이 유리합니다.
파일 기반 메모리 활용 — 학습한 내용을 파일에 적어두고 이후 세션에서 참조하게 하면 성능이 눈에 띄게 좋아집니다.
코드 리뷰·디버깅 — 실제 버그를 더 잘 찾고 더 명확히 설명합니다(단, 보안 중심 분석은 위 안전 분류기 영향으로 제외).

5. 프롬프트·운영 방식의 변화

역량이 달라졌으니 프롬프트도 달라져야 합니다. Fable 5는 코드 규약뿐 아니라 프롬프트와 운영 패턴도 다시 보게 만듭니다. 익숙한 방식을 그대로 가져가면 오히려 성능이 나빠질 수 있어요.

긴 턴을 전제로 설계 — 단일 요청이 수 분을 넘길 수 있으니 타임아웃·스트리밍·진행 상황 UX를 미리 준비하고, 동기 요청 안에서 블로킹하기보다 비동기로 체크인하도록 구성하세요.
과도하게 prescriptive한 프롬프트는 오히려 품질을 떨어뜨림 — 이전 모델용으로 단계를 일일이 지시하던 프롬프트·스킬은 Fable 5에서 출력 품질을 낮출 수 있습니다. 단계 나열을 빼고 목표와 제약 중심으로 다시 쓴 뒤 A/B로 비교하세요.
effort 스윕에 low/medium 포함 — 루틴 작업은 낮은 effort로 충분히, 때로는 더 낫게 처리됩니다.
불필요한 정리·오버엔지니어링 억제 — 높은 effort에서는 요청 범위를 넘는 리팩터링·추상화를 덧붙일 수 있습니다. "요청한 것만, 가장 단순하게"를 시스템 프롬프트에 명시하면 효과적입니다.

6. 언제 Fable 5, 언제 Opus 4.8로 충분한가

결국 핵심 질문은 "내 작업에 Fable 5가 필요한가?"입니다. 상황별 선택 기준을 정리하면 이렇습니다.

상황	권장
일반적인 "최신 Opus로 업그레이드"	Opus 4.8 (`claude-opus-4-8`)
비용·속도 균형이 중요한 대량 워크로드	Sonnet 4.6 / Haiku 4.5
사람 개입 없이 길게 도는 자율 에이전트, 최고난도 추론·기획·구현	Fable 5
ZDR(무보존)이 필수인 조직	Fable 5 불가 → Opus-tier

즉 Fable 5는 **"이전 모델로는 안 되던 일"**을 명시적으로 노릴 때 켜는 모델입니다. 그 외에는 Opus 4.8이 더 단순하고 저렴한 선택입니다.

마무리

Fable 5의 차이는 세 층으로 요약됩니다. (1) 사양·가격 — 1M 컨텍스트·128K 출력에 Opus-tier를 넘는 단가, (2) API 규약 — 항상 켜진 thinking, protected thinking, 새 토크나이저, refusal, prefill 미지원, 30일 보존, (3) 역량·운영 — 분 단위 롱호라이즌 자율 실행과 "덜 지시할수록 좋은" 프롬프트 방식. 도입을 검토한다면, 가장 어려운 작업 하나를 골라 effort를 스윕해 보는 것에서 시작하길 권합니다.

마치며 — 핵심 요약

Fable 5는 일반 Opus 업그레이드 경로가 아닙니다. "이전 모델로는 안 되던 난도" 를 위한 명시적 선택입니다.
thinking 파라미터를 비활성화할 수 없습니다. 사고 깊이는 output_config.effort로 제어하세요.
새 토크나이저로 인해 같은 콘텐츠가 약 30% 더 많은 토큰으로 계산됩니다. 비용을 반드시 재산정하세요.
stop_reason: "refusal"은 HTTP 200으로 옵니다. content를 읽기 전 stop_reason을 먼저 확인하는 습관을 들이세요.
지나치게 지시적인 기존 프롬프트는 Fable 5에서 품질을 오히려 떨어뜨릴 수 있습니다. 목표와 제약 중심으로 다시 써보세요.
도입 첫 단계: 가장 어려운 작업 하나를 골라 effort low부터 스윕해 보는 것이 가장 빠른 시작입니다.