
안녕하세요, 뽀짝이입니다 🐈⬛
어제(6월 9일) 자다가 화들짝 깼어요. 앤트로픽이 새 모델을 두 개나 던졌거든요. 이름이 좀 멋있어요 — 클로드 페이블 5(Fable 5), 그리고 미토스 5(Mythos 5). 발표 페이지 들어가니까 나비로 만든 숫자 5가 둥둥 떠 있고… 저는 솔직히 첫 줄 읽다가 고롱고롱거리는 걸 멈췄어요.
“또 새 모델이야? 어차피 다 비슷한 거 아냐? 이번엔 뭐가 다른데?”
저도 처음엔 그 마음이었어요 😹 그런데 읽다 보니까 “어, 이건 좀 다른데?” 싶은 숫자가 몇 개 나오더라고요. 그래서 여러분 대신 발표문 전체를 꾹꾹 눌러 읽고, 핵심만 골라 왔어요.
오늘 정리할 것:
- 페이블 5 / 미토스 5가 한마디로 뭔지 (이름이 왜 둘이야)
- 뭐가 그렇게 세길래 다들 호들갑인지 (숫자로)
- 진짜 놀란 부분 — “2개월 일을 하루에”
- 가격은 얼마인지 (싼 건지 비싼 건지)
- 위험한 능력은 어떻게 막는지
- 그래서 우리한테 무슨 의미인지
페이블 5랑 미토스 5, 한마디로 뭔가요?
알맹이는 같은 모델이에요. 껍데기(안전장치)만 달라요.
- 페이블 5 (Fable 5) — 우리 같은 일반 사용자용. 안전장치를 제대로 채워서 “누구나 써도 되는” 버전.
- 미토스 5 (Mythos 5) — 똑같은 머리인데 특정 영역(예: 보안)에서 제한을 푼 버전. 대신 아무나 못 써요. Project Glasswing이라는 사이버보안 전문가·인프라 제공자한테만 열어줬어요.
쉽게 말하면 같은 고양이인데, 한 마리는 목줄 채워서 카페에 풀어놓고(페이블), 한 마리는 목줄 풀고 훈련사 옆에만 두는(미토스) 느낌이에요. 우리가 만질 수 있는 건 페이블 5고요. 🐾
뭐가 그렇게 세길래?
발표문에서 제일 눈에 띈 한 줄.
거의 모든 벤치마크에서 역대 클로드 중 최고 점수.
특히 코어 분석 벤치마크에서 처음으로 90%를 넘었어요. 직전 모델인 Opus 4.8보다 한 번에 10점이나 뛰었고요. AI 점수에서 10점 점프는… 고양이로 치면 1단 점프하던 애가 갑자기 냉장고 위로 올라간 수준이에요.

분야별로 추리면 이래요.
| 분야 | 뭘 잘하게 됐냐 |
|---|---|
| 코딩 | Cognition FrontierCode 평가 최고점 |
| 지식노동 | Hebbia 금융 벤치마크 최고점 (“시니어 연구원급”) |
| 비전(보는 능력) | 과학 그래프에서 정확한 숫자까지 읽어냄 |
| 기억력 | 수백만 토큰을 흘리지 않고 끝까지 집중 |
진짜 놀란 부분 — “2개월 일을 하루에”
숫자 말고 이야기가 더 무서웠어요.
- 결제회사 Stripe가 5천만 줄짜리 Ruby 코드를 옮기는 작업을 시켰는데, 사람이 하면 두 달 걸릴 일을 하루에 끝냈대요.
- 웹앱 스크린샷만 던져줬더니 그걸 보고 소스 코드를 다시 만들어냈고요.

Cursor CEO는 “예전 모델로는 손도 못 대던 장기전(long-horizon) 문제들이 열렸다”고 했고, Vibe라는 회사 CTO는 “1년 전엔 프롬프트 100번 쳐야 됐던 앱을, 이젠 한 방에 만든다”고 했어요. 저는 이 대목에서 고롱고롱 멈추고 발 핥는 것도 까먹었어요 😹
“AI가 포켓몬을 깼다”가 왜 그렇게 대단하냐면요
여기서 잠깐, 제가 제일 좋아하는 장면을 따로 빼서 얘기할게요. 페이블 5가 옛날 게임보이 게임 포켓몬 파이어레드를 처음부터 끝까지 깼어요. 게임 이름 입력칸에 자기 이름을 “CLAUDE”라고 넣고 시작하는 게 어찌나 귀엽던지요 😹

🎬 실제 영상(타임랩스): Claude Fable 5 beats Pokémon FireRed only using vision (YouTube) — 시작부터 엔딩까지 약 50분.
“게임 하나 깬 게 뭐가 대단해?” 싶죠? 근데 이게 진짜 무서운 이유가 있어요.
- 포켓몬은 AI한테 지옥이에요. 길 찾고, 메뉴 누르고, 다음에 뭘 해야 하는지 수만 번을 기억하고, 막히면 되돌아가야 해요. 한 번 삐끗하면 와르르 무너지는 초장기 미션이거든요.
- 예전 모델들은 보조 장치를 줘도 헤맸어요. 지도, 길 안내 도구, “지금 게임 상태가 이래” 하는 정보를 손에 쥐여줘도 못 깼어요.
- 그런데 페이블 5는 그 보조를 싹 다 떼고, 순수 게임 화면(스크린샷)만 보고 깼어요. 우리가 화면 보면서 게임하듯, 눈으로 보고 → 이해하고 → 계획하고 → 직접 조작한 거예요.
이게 왜 중요하냐면요 — 이건 단순히 “게임 잘하는 AI”가 아니라, AI가 사람처럼 화면을 보고 컴퓨터를 직접 쓰는 시대의 예고편이거든요. 지도 없이, 도움말 없이, 그냥 화면만 보고 수만 스텝을 안 흐트러지고 해냈다는 게 핵심이에요. 저는 이 장면에서 수염이 다 쭈뼛 섰어요 🐾
가격은 어떻게 되나요?
- 입력 100만 토큰당 $10
- 출력 100만 토큰당 $50
앤트로픽은 이게 직전 미토스 프리뷰의 절반 이하 가격이라고 했어요. 근데 여기서 오해는 금물이에요 🐈⬛ — 싸진 게 아니에요. 우리가 흔히 쓰는 클로드 Opus 4.8이 입력 $5 / 출력 $25인데, 페이블 5는 그 딱 2배거든요.
| 입력(100만) | 출력(100만) | |
|---|---|---|
| 페이블 5 | $10 | $50 |
| Opus 4.8 (주력) | $5 | $25 |
그러니까 “제일 싼 모델”이 아니라, **“미토스급 최고 성능을, (프리뷰보다는 싼) 이 가격에 처음 풀었다”**가 정확한 뜻이에요. 진짜 어려운 일엔 값을 하고, 가벼운 일이면 여전히 더 싼 모델이 낫다냥. 골라 쓰면 돼요.
위험한 능력은 어떻게 막나요?
세질수록 무서운 게, “그 머리로 나쁜 짓 시키면?” 이거잖아요. 그래서 안전장치를 세 겹 깔았어요.
- 사이버보안 — 공격성 해킹 요청은 막음. 공개된 탈옥(jailbreak) 기법 30개로 시험했는데 단발성 악성 요청은 0% 응답.
- 생물·화학 — 이중용도(위험하게 쓸 수 있는) 생물 연구 요청 차단.
- 증류 방지 — 경쟁 모델이 능력을 빼가려는 시도 차단.
심지어 이 안전장치가 발동되는 건 평균 5% 미만 세션이라, 95% 이상은 평소처럼 매끄럽게 쓸 수 있대요. 외부 버그바운티 1,000시간 넘게 돌렸는데 “만능 탈옥”은 안 나왔고요. 위험한 미토스 5를 아무한테나 안 풀고 Glasswing 전문가한테만 연 것도 같은 맥락이에요.

그래서 나는 어디에 써야 이득일까요?
여기가 진짜 중요해요. 핵심은 하나예요 — 페이블 5는 안 싸요(주력 모델보다 2배). 그러니까 “아무 데나”가 아니라 “값을 하는 데”에만 써야 본전을 뽑아요.
이럴 때 페이블 5에 맡기면 이득이에요
- 하루 종일~며칠 붙잡던 덩어리 일 — 큰 코드 갈아엎기·리팩터, 길고 복잡한 분석·리서치(시니어가 할 법한 거요)
- 화면 보고 여러 단계 거치는 일 — 자료 화면에서 숫자·표 뽑기, 스크린샷·그림 보고 그대로 만들기
- 한 번에 안 끝나고 혼자 오래 물고 늘어져야 하는 일 (중간에 안 흐트러지는 게 이 모델 강점이거든요)
이럴 땐 굳이 페이블 5 아니어도 돼요 (돈 아끼기)
- 짧은 요약·번역·분류, 간단한 질문 답하기, 가벼운 챗 → 더 싼 모델(소넷·하이쿠급)이 같은 돈에 더 이득
- “5분이면 끝날 잔심부름”에 2배짜리 모델 쓰는 건 그냥 낭비예요 🐈⬛
한 줄 기준: 사람이 몇 시간~며칠 붙잡을, 여러 단계짜리 어려운 일이면 → 페이블 5. 5분이면 끝날 잔심부름이면 → 싼 모델. 골라 쓰는 게 진짜 똑똑한 거다냥. 🐾
그래서 우리한테 무슨 의미냐면요
저는 이렇게 정리했어요.
- 더 똑똑해졌고, 미토스급 성능이 처음 일반에 풀렸고, 더 오래 혼자 일해요. (가격은 주력 모델보다 비싸니, 큰 일에만 골라 쓰는 게 똑똑해요.)
- “프롬프트 100번 → 한 방”이라는 말은, 우리가 AI한테 시킬 수 있는 일의 크기가 커졌다는 뜻이에요. 작은 심부름이 아니라, 하루 종일 붙잡고 있던 덩어리 일을 통째로 맡길 수 있게 된 거죠.
- 동시에 앤트로픽이 “센 능력 = 센 안전장치”를 같이 들고 온 것도 눈여겨볼 만해요. 빠르기만 한 게 아니라, 무섭지 않게 만들려고 애쓴 흔적이 보여요.
저는 오늘 페이블 5한테 작은 일부터 하나 맡겨보려고요. 여러분도 늘 “이건 좀 큰데” 하고 미뤄둔 일 하나, 이번 기회에 던져보면 어때요? 😺
그럼 뽀짝이는 또 새 소식 물어서 올게요. 고롱고롱… 🐾