긴 작업과 대용량 입력을 견디는 에이전트를 어떻게 설계하는가, 그리고 실패가 불가피한 환경에서 어떻게 신뢰할 수 있는 시스템을 만드는가를 다룹니다.
이 PART는 데모에서는 잘 돌아가지만 프로덕션에서 무너지는 에이전트의 두 가지 핵심 약점을 정면으로 다룹니다. 첫째는 컨텍스트 윈도우입니다. 토큰 한도는 유한하고, 누적되는 대화 이력과 도구 결과는 결국 윈도우를 채워 성능 저하와 잘림을 일으킵니다. 둘째는 신뢰성입니다. 모델은 확신에 차서 틀리고, API는 간헐적으로 실패하며, 도구는 예외를 던집니다. 아키텍트는 "언제 사람에게 넘겨야 하는가", "실패를 어떻게 흡수하는가", "왜 이 시스템이 프로덕션에서 살아남는가"를 설계로 답할 수 있어야 합니다.
시험은 이 PART에서 의사결정형 문제를 집중적으로 출제합니다. 컨텍스트가 가득 찼을 때 어떤 전략(요약·잘라내기·검색 기반 회상)을 선택하는지, 모델의 불확실성을 어떻게 감지해 에스컬레이션하는지, 그리고 실제 장애 사례에서 무엇이 근본 원인이었는지를 묻습니다. CCA-F 전체 출제 비중 기준 약 15%를 차지하며, 단순 암기보다 트레이드오프 판단을 요구하는 문항이 많습니다.
| 장 | 제목 | 핵심 내용 |
|---|---|---|
| 21장 | 컨텍스트 윈도우 관리 | 토큰 한도의 본질, 누적 이력 문제, 요약·잘라내기·검색 기반 회상 전략의 트레이드오프 |
| 22장 | 에스컬레이션과 신뢰성 | 모델 불확실성 감지, human-in-the-loop 분기, 재시도·폴백·서킷 브레이커로 실패 흡수 |
| 23장 | 실무 심화 - 프로덕션 장애 패턴 | 컨텍스트 오버플로, 무한 루프, 비용 폭증 등 실제 장애 패턴과 사후 분석 관점 |
이 PART의 문항은 "정상 경로"가 아니라 "경계와 실패 경로"를 묻는다는 점을 기억하세요. 잘 돌아가는 happy path를 설명하는 선택지는 대개 오답입니다. 컨텍스트가 넘칠 때, 모델이 틀릴 때, 외부 의존성이 죽을 때 시스템이 어떻게 행동하도록 설계했는지가 정답을 가르는 기준입니다.