기획자가 알아야 할 토큰 상식, AI 서비스 기획 시 비용 감각 갖추기

토큰이 뭔지 모르면 기획을 못 한다

AI 서비스를 기획하면서 "개발자가 알아서 하겠지"라고 생각한다면, 이 글을 꼭 읽어야 합니다. 토큰(Token)은 AI 모델이 텍스트를 처리하는 기본 단위입니다. 쉽게 말하면 AI가 "글자를 읽는 데 드는 요금의 기준"입니다. 한국어로는 대략 글자 1~2자가 1토큰 정도 됩니다. 영어는 단어 하나가 보통 1~2토큰입니다.

왜 기획자가 이걸 알아야 할까요? 기획자가 "사용자가 올린 문서를 AI가 분석해서 요약해줘"라고 기획서에 쓰면, 개발자는 그 기능을 만듭니다. 그런데 사용자가 100페이지짜리 PDF를 올린다면? 그 문서를 처리하는 데 수만 토큰이 들고, 하루에 1,000명이 쓰면 엄청난 비용이 생깁니다. 이걸 기획 단계에서 파악하지 못하면, 나중에 비용 폭탄을 맞고 기능을 없애거나 유료로 전환해야 하는 상황이 생깁니다.

기획팀에서 AI 기능을 설계할 때, 토큰 개념을 전혀 모르는 기획자가 "사용자가 입력한 내용 전체를 매 대화마다 AI에 보내줘"라고 요구했습니다. 개발팀이 그대로 구현했고, 베타 출시 2주 만에 API 비용이 예상의 15배가 나왔습니다. 기획서 한 줄이 수백만 원짜리 실수가 된 것입니다. 기획자가 토큰을 이해했더라면 "최근 10개 대화만 포함"이라는 조건을 먼저 넣었을 겁니다.

토큰 공부를 기획자에게 강요하는 것처럼 느껴질 수 있지만, 사실 AI 시대에 비용 감각 없는 기획자는 설계 도면은 그리지만 공사비를 모르는 건축가와 같습니다. 이론적으로 훌륭한 기능도 비용 현실 앞에서 좌절되는 경우가 많습니다. 기획자가 토큰 기초 지식을 갖추는 건 선택이 아니라 필수가 되어가고 있습니다.

입력 토큰 vs 출력 토큰

토큰 비용은 크게 두 가지로 나뉩니다. 입력 토큰(Input Tokens)은 AI에게 보내는 내용입니다. 사용자의 질문, 시스템 설명, 첨부 문서 등이 모두 입력 토큰입니다. 출력 토큰(Output Tokens)은 AI가 생성하는 답변입니다. 출력 토큰이 보통 입력 토큰보다 2~3배 비쌉니다.

같은 모델이라도 입력과 출력 가격이 다르기 때문에, 기획할 때 "AI가 얼마나 긴 답변을 생성할지"도 비용에 큰 영향을 줍니다. "상세하고 풍부하게 답변해줘"라는 프롬프트 하나가 출력 토큰을 2배로 늘리고 비용도 그만큼 올립니다.

[Claude Sonnet 4 기준 예시 가격]
입력 토큰: $3 / 1M tokens
출력 토큰: $15 / 1M tokens
(출력이 입력의 5배)

[기획안 A: 짧은 요약 (출력 100 tokens)]
입력 500 tokens × $3/1M = $0.0015
출력 100 tokens × $15/1M = $0.0015
1회 비용: $0.003

[기획안 B: 상세 보고서 (출력 1,000 tokens)]
입력 500 tokens × $3/1M = $0.0015
출력 1,000 tokens × $15/1M = $0.015
1회 비용: $0.0165 (기획안 A의 5.5배)

월 10만 건 처리 시 차이: $300 vs $1,650 (월 $1,350 차이)

이 차이를 직접 경험했을 때 출력 길이가 비용에 얼마나 큰 영향을 미치는지 실감했습니다. "친절하고 자세하게 답해줘"라는 시스템 프롬프트 하나로 월 비용이 3배 이상 뛰었습니다. 그 이후로 모든 AI 기능 기획서에는 "최대 출력 토큰 수"를 명시하는 항목이 생겼고, 기획 단계에서 비용 시뮬레이션이 필수 절차가 됐습니다.

출력 토큰을 줄이는 것이 무조건 좋은 건 아닙니다. 너무 짧은 답변은 사용자 경험을 해칩니다. 기획자의 역할은 "충분한 품질의 답변을 최소한의 토큰으로 얻는 프롬프트 설계"입니다. 품질을 희생하지 않으면서 비용을 최적화하는 균형점을 찾아야 합니다. 이건 개발자만의 일이 아니라 기획자가 함께 고민해야 할 영역입니다.

모델별 토큰 비용 비교

2025년 기준 주요 AI 모델들의 비용 구조를 알고 있어야 기획에서 현실적인 판단을 할 수 있습니다. 물론 가격은 계속 변하므로 항상 공식 문서를 확인해야 합니다.

[주요 모델 입력/출력 토큰 가격 비교 (2025년 기준 참고용)]

Claude Haiku 3.5
 입력: $0.80/1M tokens | 출력: $4/1M tokens
 특징: 빠르고 저렴, 간단한 작업에 적합

Claude Sonnet 4
 입력: $3/1M tokens | 출력: $15/1M tokens
 특징: 균형 잡힌 성능과 비용, 범용 작업

Claude Opus 4
 입력: $15/1M tokens | 출력: $75/1M tokens
 특징: 최고 성능, 복잡한 추론/창작 작업

GPT-4o mini
 입력: $0.15/1M tokens | 출력: $0.60/1M tokens
 특징: 매우 저렴, 빠른 처리

GPT-4o
 입력: $2.50/1M tokens | 출력: $10/1M tokens
 특징: 강력한 성능, 멀티모달 지원

이 표를 처음 정리해서 팀에 공유했을 때 기획자들의 반응이 "왜 이런 걸 몰랐지?"였습니다. 같은 기능을 어떤 모델로 구현하느냐에 따라 비용이 100배까지 차이가 날 수 있다는 걸 처음 알게 된 것입니다. 그 뒤로 기획 회의에 이 비교표가 항상 등장하게 됐고, "이 기능은 Haiku로도 가능할까?"라는 질문이 자연스럽게 나오기 시작했습니다.

가격표만 보고 "가장 싼 것을 쓰자"는 결론을 내리면 안 됩니다. 비용이 싼 모델은 그만한 이유가 있습니다. 복잡한 논리 추론, 긴 문서 이해, 미묘한 감정 인식 등이 필요한 기능에 저가 모델을 쓰면 품질이 떨어지고 사용자 불만이 늘어납니다. 모델 선택은 "비용"과 "필요 품질 수준"을 함께 따져서 결정해야 합니다. 기획자가 이 판단에 적극적으로 참여해야 좋은 서비스가 나옵니다.

기획 단계에서 비용 시뮬레이션하기

기능을 기획할 때 아래 공식으로 간단한 비용 시뮬레이션을 해보면 현실적인 판단을 할 수 있습니다.

월 예상 비용 = 일일 사용자 수 × 1인 평균 요청 수
              × (평균 입력 토큰 × 입력 가격 + 평균 출력 토큰 × 출력 가격)
              × 30일

예시: AI 독서 기록 요약 서비스
- 일일 활성 사용자: 5,000명
- 1인 하루 평균 요청: 3회
- 평균 입력 (책 구절 + 질문): 800 tokens
- 평균 출력 (요약): 300 tokens
- 모델: Claude Sonnet 4 ($3/$15 per 1M)

월 비용 = 5,000 × 3 × (800×$3/1M + 300×$15/1M) × 30
        = 450,000 × ($0.0024 + $0.0045) × 30
        = 450,000 × $0.0069 × 30
        = 약 $93,150/월 (약 1억 2천만 원)

이런 시뮬레이션을 기획 초기에 했더라면 좋았을 프로젝트가 몇 번 있었습니다. 출시 후에 비용이 감당이 안 돼서 기능을 급히 유료 전환하거나 제한을 걸었을 때 사용자 반발이 심했습니다. 처음부터 "이 기능은 무제한 무료로는 불가능하고, 하루 3회 제한을 걸어야 한다"는 걸 기획서에 명시했더라면 훨씬 부드러운 서비스 운영이 가능했을 겁니다.

시뮬레이션이 완벽할 수는 없습니다. 사용자 행동 예측은 항상 불확실하고, 실제 토큰 사용량은 예상과 다를 수 있습니다. 그래서 처음에는 보수적으로 잡고(예상치의 1.5~2배), 실제 데이터가 쌓이면서 조정하는 방식이 좋습니다. 비용 시뮬레이션의 목적은 정확한 예측이 아니라 "대략 이 정도 규모구나"를 사전에 인식하고 대비하는 것입니다.

비용 감각을 키우는 실전 팁

기획자로서 AI 비용 감각을 기르기 위한 실천 방법들을 소개합니다.

1. 토큰 계산기를 즐겨찾기에 저장하세요. OpenAI의 Tokenizer(platform.openai.com/tokenizer)나 Anthropic의 Token Counter를 활용해서 기획하는 기능에 들어갈 텍스트가 몇 토큰인지 직접 확인하는 습관을 들이세요.

2. 기획서에 토큰 예산을 명시하세요. "이 기능의 1회 처리 최대 토큰: 2,000 tokens (입력 1,500 + 출력 500)"처럼 구체적인 숫자를 기획서에 포함시키세요. 그래야 개발자가 구현할 때 기준을 가질 수 있습니다.

3. 프롬프트 길이에 민감해지세요. 시스템 프롬프트가 길면 매 요청마다 그만큼의 비용이 더 발생합니다. "더 친절하게"라는 지시 한 줄이 출력 토큰을 30% 늘릴 수 있습니다.

4. 사용 빈도가 높은 기능일수록 토큰 최적화가 중요합니다. 하루 10명이 쓰는 기능과 하루 10만 명이 쓰는 기능은 토큰 낭비의 무게가 전혀 다릅니다. 핵심 기능의 토큰 효율을 먼저 챙기세요.

이 팁들을 팀에 공유하고 나서 기획 문화가 바뀌었습니다. "이 기능 좋은데, 토큰 비용은?"이라는 질문이 자연스럽게 나오게 됐습니다. 처음에는 개발자들만의 영역이라고 생각했던 비용 이슈가 기획자도 함께 책임지는 문화가 만들어졌습니다. AI 서비스는 팀 전체가 비용 감각을 가질 때 지속 가능해집니다.

기획자가 토큰을 공부하는 건 개발자의 영역을 침범하는 게 아닙니다. 오히려 기획자가 비용 언어로 소통할 수 있어야 개발자, 디자이너, 경영진이 같은 그림을 보며 일할 수 있습니다. AI 서비스에서 토큰 감각은 웹 서비스에서 서버 비용 감각과 같습니다. 모르면 설계가 공중에 뜨게 됩니다. 어렵게 생각하지 말고, 지금 당장 토큰 계산기 하나만 써보는 것부터 시작하세요.

📌 출처 및 참고 자료

Anthropic Claude 모델 가격 공식 페이지: https://www.anthropic.com/pricing
Anthropic Claude 모델 목록 및 스펙: https://docs.anthropic.com/en/docs/about-claude/models
OpenAI Tokenizer 도구: https://platform.openai.com/tokenizer
OpenAI 모델 가격: https://openai.com/api/pricing/
Anthropic — Prompt Engineering 공식 가이드: https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview
Google AI Studio 토큰 계산기: https://aistudio.google.com/

저작자표시 비영리 동일조건 (새창열림)

⚡ 정보 부스터 <IT, 맛집투어, 여행을가자, 이모저모> 🚀