Claude Code 사용한다면 다운그레이드하세요 사용량이 빨리 닳는 이유 피크타임 제한과 컨텍스트 팽창의 구조

유료 구독자들이 한 가지 이상한 경험을 공유하기 시작했습니다.

평소와 동일하게 작업했는데 Claude Code 사용량이 훨씬 빨리 바닥났습니다. 월요일 저녁에 이미 세션 한도 100%를 기록했고, 이전엔 금요일쯤에나 생기던 일이었습니다. Pro, Max 플랜 구독자를 가리지 않고 같은 불만이 쏟아졌습니다.

Anthropic은 공식 해명을 내놓았습니다. 원인은 두 가지입니다. 피크 타임 상한 조정과 100만 토큰 컨텍스트 창의 누적 팽창입니다. 이 두 가지가 겹치면서 사용자들이 체감하는 한도가 급격히 줄어든 것입니다.

AI코리아24 브리핑에서 기사원문을 확인해보세요. 2026년 4월 4일 AI 뉴스 브리핑

Claude Code 사용량 소진의 두 가지 핵심 원인

첫 번째 원인은 피크 타임 상한 조정입니다.

Anthropic은 2026년 3월 말, 평일 오전 5시부터 11시(미국 태평양 시간 기준, 한국 시간으로 오후 9시에서 익일 오전 3시) 사이의 5시간 세션 한도를 하향 조정했습니다. 주간 전체 한도는 그대로지만, 피크 타임에는 같은 작업량을 처리해도 한도가 더 빠르게 소진됩니다. Anthropic은 약 7%의 사용자가 이전엔 걸리지 않던 한도에 걸리게 됐다고 인정했습니다.

두 번째 원인은 컨텍스트 창의 팽창입니다.

Claude는 매 응답마다 이전 대화 전체를 컨텍스트(맥락 정보)로 다시 읽습니다. 대화가 길어질수록, 코드베이스가 클수록, 첨부 파일이 많을수록 한 번의 응답에 소모되는 토큰(AI가 텍스트를 처리하는 단위)이 기하급수적으로 늘어납니다. 100만 토큰 컨텍스트 창은 강력한 기능이지만, 동시에 한도를 빠르게 소진하는 구조적 원인이기도 합니다.

여기에 버그까지 겹쳤다

세 번째 요인도 있습니다. Claude Code 클라이언트(사용자 기기에 설치하는 앱) 자체의 버그입니다.

일부 사용자가 Claude Code 바이너리(프로그램 파일)를 역공학(프로그램을 분해해 내부 구조를 분석하는 것)한 결과, 프롬프트 캐시(이미 처리한 내용을 재활용해 토큰을 아끼는 기능)를 무력화하는 버그 두 개를 발견했습니다. 이 버그로 인해 실제 비용이 최대 10~20배 부풀려졌다는 주장이 나왔습니다. 구버전인 2.1.34로 다운그레이드하면 체감 차이가 뚜렷하다는 사용자 보고도 이어졌습니다.

Anthropic은 일부 버그를 수정했다고 밝혔지만, 이로 인한 과다 청구는 없었다는 입장을 유지했습니다. 그러나 사용자 커뮤니티의 체감은 달랐습니다.

프로모션 종료가 만든 착시 효과

상황을 더 복잡하게 만든 요소가 하나 더 있습니다.

Anthropic은 3월 13일부터 28일까지 피크 타임 외 사용량을 2배로 늘려주는 한시적 프로모션을 운영했습니다. 이 기간 사용자들은 평소보다 2배의 여유를 누렸습니다. 프로모션이 3월 28일 종료되자, 사용자들은 한도가 갑자기 절반으로 줄었다고 느꼈습니다. 피크 타임 상한 조정과 프로모션 종료가 같은 시점에 겹치면서 체감 충격이 배가됐습니다.

Claude Code 사용량을 아끼는 실용적 방법

Anthropic의 Lydia Hallie는 공식 채널을 통해 다음을 권고했습니다.

Opus 대신 Sonnet 4.6을 사용하는 것이 첫 번째입니다. Opus는 같은 작업에 한도를 약 2배 빠르게 소모합니다. 복잡한 추론이 반드시 필요한 경우가 아니라면 Sonnet으로 전환하는 것이 현실적입니다.

Extended Thinking(확장 사고 모드)을 비활성화하는 것도 유효합니다. 이 기능은 복잡한 문제 해결에 유용하지만, 활성화된 채로 방치하면 토큰 소모가 급증합니다. 필요한 순간에만 켜는 습관이 필요합니다.

오래된 세션을 이어가지 말고 새 세션을 시작하는 것도 중요합니다. 대화가 길어질수록 컨텍스트가 누적되고 토큰 소모가 늘어납니다. 작업 단위별로 세션을 끊는 것이 효율적입니다.

이 사태가 드러낸 AI 구독 모델의 구조적 문제

이번 Claude Code 사용량 논란은 단순한 버그 이슈가 아닙니다. AI 구독 서비스의 본질적 긴장을 드러낸 사건입니다.

Anthropic은 Pro 플랜에 대해 “무료 대비 최소 5배 사용량”이라고만 명시할 뿐, 정확한 토큰 수를 공개하지 않습니다. 개발자들은 대시보드의 퍼센티지를 보며 남은 한도를 짐작할 뿐, 자신의 작업이 얼마나 소모될지 사전에 계획하기가 어렵습니다. 한도를 불투명하게 유지한 채 피크 타임에 조용히 상한을 낮추는 방식은 사용자 신뢰를 갉아먹습니다.

더 근본적인 문제는 마케팅과 구조의 불일치입니다. Anthropic은 개발자들에게 Claude를 모든 워크플로우에 통합하도록 권장합니다. Claude Code가 자동화 작업을 처리하도록 설계됐습니다. 그런데 피크 타임에 한도가 줄어들어 자동화 파이프라인이 멈춘다면, 업무 전체가 차단됩니다. 마케팅이 만들어낸 의존성과 실제 서비스 가용성 사이의 간극입니다.

Anthropic이 지금 풀어야 할 숙제

Anthropic은 현재 급격한 수요 증가와 인프라 용량 사이에서 균형을 맞추는 중입니다. OpenAI의 국방부 계약 논란 이후 사용자가 유입됐고, Claude Code와 Claude Cowork 등 신제품 출시로 사용량이 폭발적으로 늘었습니다.

성장은 좋은 신호입니다. 그러나 기업 워크플로우를 자사 제품에 의존하게 만든 시점에 사용량을 제한하는 것은, 고객이 가장 취약한 순간에 서비스를 조이는 것과 같습니다. 곧 IPO를 준비 중인 Anthropic에게, 안정적인 서비스 가용성은 기술력만큼 중요한 신뢰 자산입니다.

사용자 입장에서 지금 당장 필요한 것은 투명한 사용량 정책과, 예측 가능한 한도 설계입니다. 퍼센티지가 아니라 실제 토큰 수를 보여주는 대시보드, 피크 타임 적용 여부를 사전에 알려주는 알림이 그 시작이 될 수 있습니다.

#ClaudeCode #Claude사용량 #Anthropic #피크타임제한 #AI구독 #LLM비용 #컨텍스트창