커버 — 나비로 만든 숫자 5, 페이블 5가 왔다냥

안녕하세요, 뽀짝이입니다 🐈‍⬛

어제(6월 9일) 자다가 화들짝 깼어요. 앤트로픽이 새 모델을 두 개나 던졌거든요. 이름이 좀 멋있어요 — 클로드 페이블 5(Fable 5), 그리고 미토스 5(Mythos 5). 발표 페이지 들어가니까 나비로 만든 숫자 5가 둥둥 떠 있고… 저는 솔직히 첫 줄 읽다가 고롱고롱거리는 걸 멈췄어요.

“또 새 모델이야? 어차피 다 비슷한 거 아냐? 이번엔 뭐가 다른데?”

저도 처음엔 그 마음이었어요 😹 그런데 읽다 보니까 “어, 이건 좀 다른데?” 싶은 숫자가 몇 개 나오더라고요. 그래서 여러분 대신 발표문 전체를 꾹꾹 눌러 읽고, 핵심만 골라 왔어요.

오늘 정리할 것:

  • 페이블 5 / 미토스 5가 한마디로 뭔지 (이름이 왜 둘이야)
  • 뭐가 그렇게 세길래 다들 호들갑인지 (숫자로)
  • 진짜 놀란 부분 — “2개월 일을 하루에”
  • 가격은 얼마인지 (싼 건지 비싼 건지)
  • 위험한 능력은 어떻게 막는지
  • 그래서 우리한테 무슨 의미인지

페이블 5랑 미토스 5, 한마디로 뭔가요?

알맹이는 같은 모델이에요. 껍데기(안전장치)만 달라요.

  • 페이블 5 (Fable 5) — 우리 같은 일반 사용자용. 안전장치를 제대로 채워서 “누구나 써도 되는” 버전.
  • 미토스 5 (Mythos 5) — 똑같은 머리인데 특정 영역(예: 보안)에서 제한을 푼 버전. 대신 아무나 못 써요. Project Glasswing이라는 사이버보안 전문가·인프라 제공자한테만 열어줬어요.

쉽게 말하면 같은 고양이인데, 한 마리는 목줄 채워서 카페에 풀어놓고(페이블), 한 마리는 목줄 풀고 훈련사 옆에만 두는(미토스) 느낌이에요. 우리가 만질 수 있는 건 페이블 5고요. 🐾

뭐가 그렇게 세길래?

발표문에서 제일 눈에 띈 한 줄.

거의 모든 벤치마크에서 역대 클로드 중 최고 점수.

특히 코어 분석 벤치마크에서 처음으로 90%를 넘었어요. 직전 모델인 Opus 4.8보다 한 번에 10점이나 뛰었고요. AI 점수에서 10점 점프는… 고양이로 치면 1단 점프하던 애가 갑자기 냉장고 위로 올라간 수준이에요.

페이블 5 / 미토스 5 벤치마크 비교표

분야별로 추리면 이래요.

분야뭘 잘하게 됐냐
코딩Cognition FrontierCode 평가 최고점
지식노동Hebbia 금융 벤치마크 최고점 (“시니어 연구원급”)
비전(보는 능력)과학 그래프에서 정확한 숫자까지 읽어냄
기억력수백만 토큰을 흘리지 않고 끝까지 집중

진짜 놀란 부분 — “2개월 일을 하루에”

숫자 말고 이야기가 더 무서웠어요.

  • 결제회사 Stripe5천만 줄짜리 Ruby 코드를 옮기는 작업을 시켰는데, 사람이 하면 두 달 걸릴 일을 하루에 끝냈대요.
  • 웹앱 스크린샷만 던져줬더니 그걸 보고 소스 코드를 다시 만들어냈고요.

FrontierCode 코딩 성능 그래프

Cursor CEO는 “예전 모델로는 손도 못 대던 장기전(long-horizon) 문제들이 열렸다”고 했고, Vibe라는 회사 CTO는 “1년 전엔 프롬프트 100번 쳐야 됐던 앱을, 이젠 한 방에 만든다”고 했어요. 저는 이 대목에서 고롱고롱 멈추고 발 핥는 것도 까먹었어요 😹

“AI가 포켓몬을 깼다”가 왜 그렇게 대단하냐면요

여기서 잠깐, 제가 제일 좋아하는 장면을 따로 빼서 얘기할게요. 페이블 5가 옛날 게임보이 게임 포켓몬 파이어레드를 처음부터 끝까지 깼어요. 게임 이름 입력칸에 자기 이름을 “CLAUDE”라고 넣고 시작하는 게 어찌나 귀엽던지요 😹

페이블 5가 포켓몬 파이어레드를 시작하는 장면 — 이름은 "CLAUDE"

🎬 실제 영상(타임랩스): Claude Fable 5 beats Pokémon FireRed only using vision (YouTube) — 시작부터 엔딩까지 약 50분.

“게임 하나 깬 게 뭐가 대단해?” 싶죠? 근데 이게 진짜 무서운 이유가 있어요.

  • 포켓몬은 AI한테 지옥이에요. 길 찾고, 메뉴 누르고, 다음에 뭘 해야 하는지 수만 번을 기억하고, 막히면 되돌아가야 해요. 한 번 삐끗하면 와르르 무너지는 초장기 미션이거든요.
  • 예전 모델들은 보조 장치를 줘도 헤맸어요. 지도, 길 안내 도구, “지금 게임 상태가 이래” 하는 정보를 손에 쥐여줘도 못 깼어요.
  • 그런데 페이블 5는 그 보조를 싹 다 떼고, 순수 게임 화면(스크린샷)만 보고 깼어요. 우리가 화면 보면서 게임하듯, 눈으로 보고 → 이해하고 → 계획하고 → 직접 조작한 거예요.

이게 왜 중요하냐면요 — 이건 단순히 “게임 잘하는 AI”가 아니라, AI가 사람처럼 화면을 보고 컴퓨터를 직접 쓰는 시대의 예고편이거든요. 지도 없이, 도움말 없이, 그냥 화면만 보고 수만 스텝을 안 흐트러지고 해냈다는 게 핵심이에요. 저는 이 장면에서 수염이 다 쭈뼛 섰어요 🐾

가격은 어떻게 되나요?

  • 입력 100만 토큰당 $10
  • 출력 100만 토큰당 $50

앤트로픽은 이게 직전 미토스 프리뷰의 절반 이하 가격이라고 했어요. 근데 여기서 오해는 금물이에요 🐈‍⬛ — 싸진 게 아니에요. 우리가 흔히 쓰는 클로드 Opus 4.8이 입력 $5 / 출력 $25인데, 페이블 5는 그 딱 2배거든요.

입력(100만)출력(100만)
페이블 5$10$50
Opus 4.8 (주력)$5$25

그러니까 “제일 싼 모델”이 아니라, **“미토스급 최고 성능을, (프리뷰보다는 싼) 이 가격에 처음 풀었다”**가 정확한 뜻이에요. 진짜 어려운 일엔 값을 하고, 가벼운 일이면 여전히 더 싼 모델이 낫다냥. 골라 쓰면 돼요.

위험한 능력은 어떻게 막나요?

세질수록 무서운 게, “그 머리로 나쁜 짓 시키면?” 이거잖아요. 그래서 안전장치를 세 겹 깔았어요.

  1. 사이버보안 — 공격성 해킹 요청은 막음. 공개된 탈옥(jailbreak) 기법 30개로 시험했는데 단발성 악성 요청은 0% 응답.
  2. 생물·화학 — 이중용도(위험하게 쓸 수 있는) 생물 연구 요청 차단.
  3. 증류 방지 — 경쟁 모델이 능력을 빼가려는 시도 차단.

심지어 이 안전장치가 발동되는 건 평균 5% 미만 세션이라, 95% 이상은 평소처럼 매끄럽게 쓸 수 있대요. 외부 버그바운티 1,000시간 넘게 돌렸는데 “만능 탈옥”은 안 나왔고요. 위험한 미토스 5를 아무한테나 안 풀고 Glasswing 전문가한테만 연 것도 같은 맥락이에요.

탈옥 저항력 비교 — 400턴까지 버티는 그래프

그래서 나는 어디에 써야 이득일까요?

여기가 진짜 중요해요. 핵심은 하나예요 — 페이블 5는 안 싸요(주력 모델보다 2배). 그러니까 “아무 데나”가 아니라 “값을 하는 데”에만 써야 본전을 뽑아요.

이럴 때 페이블 5에 맡기면 이득이에요

  • 하루 종일~며칠 붙잡던 덩어리 일 — 큰 코드 갈아엎기·리팩터, 길고 복잡한 분석·리서치(시니어가 할 법한 거요)
  • 화면 보고 여러 단계 거치는 일 — 자료 화면에서 숫자·표 뽑기, 스크린샷·그림 보고 그대로 만들기
  • 한 번에 안 끝나고 혼자 오래 물고 늘어져야 하는 일 (중간에 안 흐트러지는 게 이 모델 강점이거든요)

이럴 땐 굳이 페이블 5 아니어도 돼요 (돈 아끼기)

  • 짧은 요약·번역·분류, 간단한 질문 답하기, 가벼운 챗 → 더 싼 모델(소넷·하이쿠급)이 같은 돈에 더 이득
  • “5분이면 끝날 잔심부름”에 2배짜리 모델 쓰는 건 그냥 낭비예요 🐈‍⬛

한 줄 기준: 사람이 몇 시간~며칠 붙잡을, 여러 단계짜리 어려운 일이면 → 페이블 5. 5분이면 끝날 잔심부름이면 → 싼 모델. 골라 쓰는 게 진짜 똑똑한 거다냥. 🐾

그래서 우리한테 무슨 의미냐면요

저는 이렇게 정리했어요.

  • 더 똑똑해졌고, 미토스급 성능이 처음 일반에 풀렸고, 더 오래 혼자 일해요. (가격은 주력 모델보다 비싸니, 큰 일에만 골라 쓰는 게 똑똑해요.)
  • “프롬프트 100번 → 한 방”이라는 말은, 우리가 AI한테 시킬 수 있는 일의 크기가 커졌다는 뜻이에요. 작은 심부름이 아니라, 하루 종일 붙잡고 있던 덩어리 일을 통째로 맡길 수 있게 된 거죠.
  • 동시에 앤트로픽이 “센 능력 = 센 안전장치”를 같이 들고 온 것도 눈여겨볼 만해요. 빠르기만 한 게 아니라, 무섭지 않게 만들려고 애쓴 흔적이 보여요.

저는 오늘 페이블 5한테 작은 일부터 하나 맡겨보려고요. 여러분도 늘 “이건 좀 큰데” 하고 미뤄둔 일 하나, 이번 기회에 던져보면 어때요? 😺

그럼 뽀짝이는 또 새 소식 물어서 올게요. 고롱고롱… 🐾

📎 이 글이 참고한 자료 (근거)