컴팩션

컴팩션 · Compaction

카테고리: 성능·최적화
난이도: advanced
태그: 컴팩션 · 컨텍스트압축
슬러그: compaction
상태: published
정렬 순서: 183

정의

긴 대화 이력이나 대규모 컨텍스트를 요약·압축하여 컨텍스트 윈도우를 효율적으로 사용하는 기술로, 컨텍스트 부패(Context Rot)를 방지하는 핵심 전략이다. 데이터베이스의 컴팩션이 분산된 데이터를 정리하여 성능을 회복하듯, AI 대화의 컴팩션은 축적된 대화 이력을 핵심 내용으로 압축하여 모델의 응답 품질을 회복한다. 실용적 방법: AI 에이전트와 100턴이 넘는 긴 대화를 했을 때, AI에게 '지금까지의 대화에서 핵심 결정사항, 현재 코드 상태, 남은 작업을 요약해줘'라고 요청한 뒤, 이 요약을 새로운 대화 세션의 시작점으로 사용한다. 이렇게 하면 100턴의 대화가 소비하던 수만 토큰 대신, 요약 몇 백 토큰으로 동일한 맥락을 유지할 수 있다. Claude Code는 자체적인 컴팩션 메커니즘을 내장하고 있으며, Anthropic의 'Long-running Agents' 연구에서도 컴팩션이 핵심 주제로 다루어지고 있다. 수동 컴팩션(인간이 요약 요청)과 자동 컴팩션(도구가 자동 실행)으로 나뉘며, 자동 컴팩션의 정확도가 에이전트의 장기 작업 능력을 결정한다.

영어 표기

Compaction

예시

100턴이 넘은 대화를 AI가 핵심 결정사항 10개로 요약한 뒤, 새로운 컨텍스트로 이어서 작업.

참고

Anthropic의 Long-running Agents 포스트에서 활발히 연구되는 주제.

Next step

용어를 읽은 다음 이어갈 흐름

가이드로 이동용어를 실제 작업 흐름에서 다시 보기

사전 정의를 읽은 뒤 바이브코딩 가이드에서 사용 맥락을 확인합니다.

질문하기이 용어가 내 작업에서 어떻게 쓰이나요?

궁금한 맥락을 Q&A로 넘겨 구체적인 답변 흐름으로 이어갑니다.

함께 읽기

컴팩션

컴팩션

용어를 읽은 다음 이어갈 흐름

연관 용어

메뉴 · 정책

컴팩션

컴팩션

용어를 읽은 다음 이어갈 흐름

연관 용어

지연시간

번들 크기

지연 로딩