본문 바로가기

Claude API7

애드센스 자동화 (API 인증, Sheets 연동, AI 분석) 매달 AdSense 대시보드에서 CSV를 받아 엑셀에 붙여넣는 작업, 해보신 분이라면 압니다. 처음엔 그냥 하다가 어느 순간 '이걸 왜 사람이 하고 있지?'라는 생각이 들죠. 저도 똑같았습니다. 포스트가 50개를 넘어가던 시점부터 수작업이 너무 버거워져서 결국 Google AdSense API와 Sheets를 연결하는 자동화 파이프라인을 직접 만들었습니다. 솔직히 처음엔 그저 시간을 아끼려는 목적이었는데, 그 과정에서 AI 분석 레이어까지 얹으면서 단순 리포팅 도구가 콘텐츠 전략 도구로 바뀐 경험을 공유하겠습니다.OAuth 2.0 인증 설정, 생각보다 어렵지 않습니다처음 API를 붙이려 할 때 가장 겁나는 부분이 인증 설정이 아닌가요? 저도 그랬습니다. 특히 AdSense API는 OAuth 2.0 인증.. 2026. 6. 7.

프롬프트 캐싱 실전 경험 (캐시 프리워밍, TTL 변경, 비용절감) 솔직히 저는 처음에 프롬프트 캐싱을 그냥 "비용 조금 아끼는 기능" 정도로 생각했습니다. 그런데 RAG 시스템에 직접 붙여보고 나서 생각이 완전히 바뀌었습니다. 하루 120달러짜리 API 비용이 13달러로 줄어드는 걸 직접 보고서야, 이게 단순한 최적화 옵션이 아니라 서비스 운영 방식 자체를 바꾸는 기능이라는 걸 실감했습니다.그런데 이 경험을 공유하면 사람들이 "그냥 cache_control 붙이면 되는 거 아닌가요?"라고 묻습니다. 그렇지 않습니다. 선언하는 것과 제대로 활용하는 것 사이에는 생각보다 큰 간격이 있습니다. 그 간격에서 비용 절감이 생기기도 하고 사라지기도 합니다.캐시 프리워밍, 알고 쓰는 것과 모르고 쓰는 것의 차이제가 운영하던 RAG 시스템은 50,000 토큰 규모의 지식 베이스를 시.. 2026. 5. 30.

LLM API 비용의 토큰 낭비 (패턴 진단, 히스토리 관리, 캐싱 전략) 파트너사의 고객 지원 봇을 처음 진단했을 때 솔직히 예상 밖이었다. 월 API 비용의 68%가 실제 AI 처리가 아닌 히스토리 재전송에 쓰이고 있었거든요. 코드는 멀쩡히 돌아가고 있었고, 아무도 문제를 몰랐다. LLM 개발에서 토큰 낭비는 대부분 이렇게 조용히 쌓인다. 이 숫자를 처음 봤을 때 든 생각은 "버그가 있는 거 아닌가"였다. 그런데 코드를 뜯어보면 뜯어볼수록 버그가 아니라 설계였다. 아무도 의심하지 않았기 때문에 아무도 고치지 않은 패턴들이 비용 구조를 조용히 갉아먹고 있었다. 이 경험 이후로 "돌아가는 코드"와 "효율적인 코드"가 얼마나 다를 수 있는지를 다시 생각하게 됐다.가장 많이 보이는 낭비 패턴 다섯 가지직접 코드 리뷰와 프로덕션 모니터링을 하면서 반복적으로 마주친 패턴들이다.첫 번째.. 2026. 5. 28.

프롬프트 토큰 최적화 247토큰 vs 18토큰 - 비교 실험, Few-shot, 비용 절감) 같은 일을 시키는 프롬프트인데 토큰이 247개짜리와 18개짜리로 나뉜다면, 그 차이가 실제 비용에서 어떻게 드러날지 궁금하지 않았는가. 나는 궁금했고, 직접 실험해봤다. 그 결과가 생각보다 꽤 명확해서, 내가 겪은 시행착오와 함께 프롬프트 토큰 최적화의 실체를 짚어보겠다.비교 실험: 같은 태스크, 다른 프롬프트내가 진행한 실험의 태스크는 단순했다. 고객 리뷰 텍스트를 긍정/부정/중립으로 분류하는 것이었다. 여기에 4가지 프롬프트 변형을 만들어 count_tokens API로 사전 측정했다. count_tokens API란 Anthropic이 무료로 제공하는 엔드포인트로, 실제 요청을 보내기 전에 예상 토큰 수를 미리 확인할 수 있는 도구다. 실험 비용 없이 프롬프트 간 토큰 차이를 비교할 수 있어서 최적.. 2026. 5. 27.

SaaS 토큰 예산 관리 - 플랜 설계, 슬라이딩 윈도우, 모델 라우팅 월 고정 요금을 내는 사용자에게 "이번 달 한도를 초과했습니다"라는 메시지를 보내는 순간, 그 사용자의 절반은 떠난다. B2B SaaS를 운영하면서 나도 이 문제를 직접 겪었다. 토큰 예산 관리를 어떻게 설계하느냐가 곧 서비스의 신뢰도와 수익성을 동시에 결정짓는다는 걸 알게 된 건 솔직히 꽤 늦은 편이었다.플랜 설계 - 요청 횟수로 제한하면 안 되는 이유"월 100회 요청 제한"이 합리적이라고 생각하는 사람들도 있는데, 나는 이 방식이 근본적으로 잘못됐다고 본다. 직접 써봤을 때 문제가 너무 명확했다.짧은 질문 100번과 긴 계약서 분석 100번은 API 비용 기준으로 수십 배 차이가 난다. 그런데 요청 횟수로만 관리하면 이 둘이 똑같이 취급된다. 라이트 유저는 한도가 너무 넉넉해서 비용 대비 낭비가 발.. 2026. 5. 26.

Claude API 비용 추적 인프라 - cost attribution, 중복 집계, 실시간 대시보드 월말에 Anthropic 청구서를 받고 나서야 "어, 이게 왜 이렇게 많이 나왔지?"라고 뒤늦게 당황한 경험이 있는가. 나는 있다. 그것도 한 번이 아니라 여러 번. Claude API를 SaaS 서비스에 붙이기 시작했을 때, 비용 관리가 이렇게 복잡한 문제가 될 거라고는 생각도 못 했다. 지금 돌아보면 그 당황스러움이 결국 꽤 중요한 인프라를 만드는 계기가 됐다.기능별 cost attribution이 안 된다는 것, 처음엔 몰랐다처음 Claude API를 붙였을 때는 Anthropic 콘솔 대시보드만 보면 충분할 거라고 생각했다. 그건 완전히 착각이었다. 대시보드는 조직 전체 토큰 소비량을 하나의 숫자로 보여줄 뿐이었다. 서비스에는 문서 요약 기능과 챗봇 기능이 함께 있었는데, 어느 쪽이 비용을 더 많.. 2026. 5. 25.

이전 1 2 다음

소개 및 문의 · 개인정보처리방침 · 면책조항

© 2026 ⚡ 정보 부스터 🚀

티스토리툴바

티스토리툴바