- Claude Code 컨텍스트 윈도우는 기본 약 200K 토큰(일부 모델·요금제 1M)이며, 크기와 무관하게 길어질수록 품질이 흐려지고 비용이 는다.
/compact는 요약 후 계속(관련 작업 지속),/clear는 초기화 후 새출발(무관한 새 작업)이다.- Claude Code는 매 요청마다 누적 컨텍스트 전체를 다시 보내므로, 쌓인 불필요 토큰은 모든 후속 요청에 반복 청구된다.
CLAUDE.md는 매 세션 자동 로드되는 영구 메모리라, /clear로 비워도 핵심 규칙은 다시 주입된다.- 긴 작업 유지법: 무관 작업 사이
/clear→ 관련 작업 중/compact→ 광범위 탐색은 서브에이전트 위임 → 필요한 파일만@로 로드.
컨텍스트 윈도우는 메모리가 아니라 자원이다
많은 사용자가 Claude Code의 컨텍스트 윈도우를 "무한히 기억하는 메모리"처럼 다룹니다. 한 대화창에서 며칠 동안 온갖 작업을 이어가고, 대용량 로그를 통째로 붙여넣고, 무관한 주제를 계속 쌓아갑니다. 그러다 응답이 점점 둔해지고 엉뚱한 답이 나오기 시작하면 "모델이 멍청해졌다"고 느낍니다.
실제로 일어난 일은 다릅니다. 컨텍스트 윈도우는 한정된 자원이고, 그 자원을 잘못 관리한 것입니다. 컨텍스트가 길어질수록 모델은 핵심 정보와 잡음을 구분하기 어려워지고, 응답 품질이 떨어집니다. 동시에 비용도 올라갑니다. 컨텍스트를 자원으로 인식하는 것이 효율적인 Claude Code 사용의 출발점입니다.
핵심 원리: Claude Code는 매 요청마다 누적된 컨텍스트 전체를 모델에 다시 전송합니다. 따라서 컨텍스트에 무엇이 쌓여 있느냐가 곧 응답 품질과 요청당 비용을 결정합니다.
컨텍스트 윈도우 크기 이해하기
Claude Code는 기본적으로 약 200K 토큰의 컨텍스트 윈도우를 사용하며, 일부 모델과 요금제에서는 1M 토큰까지 확장됩니다. 토큰과 컨텍스트 윈도우의 기본 개념은 Anthropic 공식 컨텍스트 윈도우 문서에 자세히 정리돼 있습니다. 200K 토큰은 대략 중형 코드베이스의 상당 부분을 담을 수 있는 크기지만, 무한하지는 않습니다.
| 컨텍스트 사용량 | 상태 | 권장 조치 |
|---|---|---|
| ~50% 이하 | 여유 | 그대로 진행 |
| 50~75% | 주의 | 작업 단락에서 /compact 고려 |
| 75% 이상 | 혼잡 | /compact 또는 작업 마무리 후 /clear |
컨텍스트가 가득 차면 Claude Code는 자동으로 압축(auto-compact)을 수행하기도 합니다. 하지만 자동 압축은 타이밍을 직접 제어할 수 없으므로, 중요한 작업에서는 수동으로 적절한 시점에 정리하는 편이 안전합니다.
/compact: 요약하며 계속하기
/compact 명령은 지금까지의 대화를 요약해 컨텍스트를 압축합니다. 핵심 맥락은 유지하면서 불필요하게 늘어난 부분을 줄이므로, 관련된 작업을 계속 이어갈 때 적합합니다.
예를 들어 한 기능을 여러 단계에 걸쳐 구현하는 도중 컨텍스트가 75%에 도달했다면, /compact로 지금까지의 진행 상황을 요약해 공간을 확보하고 작업을 끊김 없이 이어갈 수 있습니다.
압축에 지시를 더하기
/compact 뒤에 지시를 덧붙이면, 요약 시 무엇을 반드시 보존할지 지정할 수 있습니다.
/compact 현재 작업 중인 결제 모듈의 API 시그니처와
미해결 버그 목록은 반드시 유지해줘
팁: 중요한 작업 중에 압축할 때는 항상 보존 지시를 함께 주세요. 그냥 /compact만 하면 요약 과정에서 미묘하지만 중요한 맥락(엣지 케이스, 결정 이유 등)이 사라질 수 있습니다.
/clear: 초기화하고 새로 시작하기
/clear 명령은 컨텍스트를 완전히 비웁니다. 이전 작업의 흔적이 전혀 남지 않은 깨끗한 상태에서 다시 시작하므로, 이전 작업과 무관한 새 작업으로 넘어갈 때 적합합니다.
흔한 실수는 하나의 대화창에서 무관한 작업을 계속 이어가는 것입니다. 오전에 인증 버그를 잡고, 오후에 전혀 다른 결제 기능을 만들면서 같은 컨텍스트를 쓰면, 인증 작업의 잔재가 결제 작업의 컨텍스트를 오염시킵니다. 작업이 바뀌는 경계에서 /clear를 습관화하세요.
| 상황 | 명령 | 이유 |
|---|---|---|
| 같은 기능 작업을 계속 진행 | /compact | 맥락 유지가 필요 |
| 완전히 다른 작업으로 전환 | /clear | 이전 맥락이 오히려 방해 |
| 대용량 파일을 한 번만 참고 후 종료 | 탐색은 서브에이전트 위임 | 메인 오염 자체를 회피 |
CLAUDE.md: 비워도 사라지지 않는 메모리
/clear를 자주 쓰지 못하는 이유 중 하나는 "비우면 프로젝트 설명을 처음부터 다시 해야 한다"는 부담입니다. CLAUDE.md가 바로 이 문제를 해결합니다.
CLAUDE.md는 매 세션마다 자동으로 로드되는 영구 메모리 파일입니다. 프로젝트 루트에 두면 그 프로젝트에서, ~/.claude/CLAUDE.md에 두면 모든 프로젝트에서 항상 주입됩니다. 여기에 핵심 규칙을 적어두면 /clear로 컨텍스트를 비워도 그 정보는 다시 채워집니다. 메모리 파일의 정확한 동작과 우선순위는 Anthropic 공식 메모리 문서에서 확인하세요.
CLAUDE.md에 넣으면 좋은 것
- 프로젝트 아키텍처와 디렉터리 구조 요약
- 빌드·테스트·배포 명령어
- 코딩 컨벤션과 반드시 지켜야 할 규칙
- 자주 반복 설명하게 되는 도메인 지식
대화 중 #로 시작하는 메모를 입력하면 그 내용을 빠르게 CLAUDE.md에 추가할 수도 있습니다. 반복되는 설명을 발견할 때마다 메모리에 옮기면, 본문 컨텍스트는 점점 가벼워집니다.
관계 정리: CLAUDE.md가 영구 메모리를 책임지기 때문에 /clear와 /compact를 더 과감하게 쓸 수 있습니다. 세 가지는 따로 노는 기능이 아니라 하나의 컨텍스트 위생 시스템입니다.
컨텍스트는 곧 비용이다
컨텍스트 관리가 단순한 품질 문제가 아니라 비용 문제라는 점을 강조하고 싶습니다. Claude Code는 매 요청마다 누적된 컨텍스트 전체를 다시 모델에 보냅니다. 즉 컨텍스트에 한 번 쌓인 대용량 로그는, 그 대화가 끝날 때까지 모든 요청에 반복해서 청구됩니다.
예를 들어 5만 토큰짜리 로그를 붙여넣고 그 뒤로 20번을 더 대화하면, 그 로그는 사실상 20번 다시 전송됩니다. 정작 필요한 건 로그의 결론 한 줄이었는데 말입니다. 이런 경우 로그를 통째로 붙이는 대신, 서브에이전트에게 분석을 맡겨 결론만 받으면 토큰을 크게 아낄 수 있습니다. 비용 구조의 공식 설명은 Claude Code 비용 문서를 참고하세요.
토큰을 아끼는 실전 습관
- 선택적 로딩 — 디렉터리 전체가 아니라
@로 필요한 파일만 불러온다 - 탐색 위임 — 광범위한 코드 검색은 서브에이전트에 맡겨 메인 오염을 막는다
- 경계마다 초기화 — 작업이 바뀌면
/clear - 규칙은 메모리로 — 반복 설명은 CLAUDE.md로 옮겨 본문에서 뺀다
비용 최적화를 더 깊이 다루고 싶다면 Claude Code 비용 최적화 가이드를, 모델 선택 전략은 2026 요금제 가이드를 함께 참고하세요.
한눈에 보는 컨텍스트 위생 루틴
- 새 작업 시작 → 무관한 이전 작업이 있었다면
/clear - 작업 진행 중 컨텍스트 50~75% → 단락에서
/compact(보존 지시 포함) - 광범위 탐색이 필요 → 직접 읽지 말고 서브에이전트에 위임
- 같은 설명을 두 번째 한다 →
#로 CLAUDE.md에 추가 - 대용량 자료 → 통째 붙여넣기 대신 결론만 추출
컨텍스트 관리는 고급 기교가 아니라 기본 위생입니다. 손을 씻듯 작업 경계마다 컨텍스트를 정리하는 습관 하나만으로, 응답 품질과 비용이 동시에 좋아집니다. 가장 저렴한 최적화는 더 비싼 모델이 아니라 더 깨끗한 컨텍스트입니다.
관련 리소스
컨텍스트도 워크플로우도 한 단계 끌어올리기
직접 만들 시간을 아끼세요 — 검증된 Claude Code 스킬 번들 + 로컬 AI 글쓰기 자동화 키트.
⚡ Claude Code Skills Bundle ($19) 🛡️ GroundTruth Writer Kit ($29)