본문 바로가기

Programmer/AI

Claude Code의 한계를 넘다: claude-context-mode

반응형

AI 코딩 에이전트인 Claude Code를 사용하다 보면 가장 먼저 마주치는 벽이 있습니다. 바로 '컨텍스트 윈도우(Context Window)'의 고갈입니다. 아무리 똑똑한 Claude라도 수만 줄의 로그와 웹 페이지 전체를 한꺼번에 읽다 보면 금방 기억력을 잃고 느려지기 마련이죠.

이 문제를 우아하게 해결한 MCP(Model Context Protocol) 서버, claude-context-mode 를 소개합니다.


1. 해결하고자 하는 문제 (The Problem)

AI 에이전트가 외부 도구(MCP)를 사용할 때 발생하는 '데이터 폭발' 현상을 해결합니다.

  • 컨텍스트 낭비: 웹 브라우저 스냅샷 하나가 약 56KB, GitHub 이슈 목록이 60KB를 차지합니다.
  • 빠른 성능 저하: 몇 번의 도구 실행만으로 200K 토큰의 컨텍스트 창이 꽉 차버립니다. 보통 30분 정도 작업하면 컨텍스트의 70%가 무의미한 원본 데이터로 채워집니다.
  • 비용과 속도: 컨텍스트가 커질수록 모델의 응답 속도는 느려지고, API 사용 비용(토큰 소비)은 급증합니다.

2. 작동 메커니즘 (Mechanism)

이 도구는 Claude와 외부 데이터 사이에서 '지능형 필터' 역할을 수행합니다.

🛡️ 샌드박스 실행 (execute)

코드를 직접 실행할 때, 모든 내부 처리 과정을 Claude에게 보여주지 않습니다. 격리된 환경(Sandbox)에서 코드를 돌린 후, 최종 결과값(stdout)만 요약해서 전달합니다.

🔍 스마트 인덱싱 및 검색 (index & search)

방대한 데이터를 그대로 컨텍스트에 넣는 대신, SQLite FTS5(전체 텍스트 검색) 기술을 사용해 데이터를 로컬에 인덱싱합니다.

  • BM25 알고리즘: 검색어와 가장 관련성이 높은 부분만 추출합니다.
  • 필요한 만큼만: Claude는 "전체 로그를 다 읽어줘"가 아니라 "로그 중에서 에러 발생 구간만 검색해줘"라고 요청하게 됩니다.

🌐 웹 추출 최적화 (fetch_and_index)

URL에서 HTML 전체를 긁어오는 대신, 마크다운으로 변환 후 핵심 내용만 인덱싱하여 Claude에게는 검색 결과만 제공합니다.


3. 도입 효과 (Key Benefits)

숫자로 증명되는 압도적인 효율성을 보여줍니다.

항목 기존 방식 Context Mode 적용 시 절약률
Playwright 스냅샷 56.2 KB 299 B 99%
GitHub 이슈(20개) 58.9 KB 1.1 KB 98%
전체 세션 컨텍스트 315 KB 5.4 KB 98%
  • 작업 지속 시간 증가: 기존 30분이면 버벅이던 세션을 최대 3시간 이상 쾌적하게 유지할 수 있습니다.
  • 정확도 향상: 불필요한 노이즈 데이터가 사라지므로 Claude가 문제 해결에 더 집중할 수 있습니다.

💡 주의사항 및 고려할 점 (Precautions)

  1. 의존성 환경: Node.js 18버전 이상이 필요하며, 더 빠른 실행을 위해 Bun 설치를 권장합니다.
  2. 데이터 누락 가능성: 아주 드물게, 요약이나 필터링 과정에서 Claude가 놓치는 미세한 맥락이 있을 수 있습니다. (이 경우 상세 검색 기능을 활용해야 합니다.)
  3. 로컬 리소스: 인덱싱 프로세스가 로컬에서 실행되므로, 아주 저사양 PC에서는 약간의 오버헤드가 발생할 수 있습니다.

🛠️ 설치 및 시작하기

Claude Code 사용자라면 터미널에서 아래 한 줄로 바로 설치가 가능합니다.

Bash
 
# MCP 서버 추가
claude mcp add context-mode -- npx -y context-mode

# 플러그인 설치 (자동 라우팅 기능 포함)
/plugin install context-mode@claude-context-mode

 

반응형