22장. 에스컬레이션과 신뢰성
에이전트를 "끝까지 자동으로 돌리는 것"이 목표였던 시절은 지났다. 실무에서 자격증이 요구하는 아키텍트의 역량은 정반대다. 에이전트가 자신의 한계를 인식하고, 위험한 순간에 멈추며, 사람이나 상위 시스템으로 결정 권한을 넘기는 경로를 설계할 수 있는가. 이것이 에스컬레이션이다. 자율성과 안전성은 트레이드오프가 아니라 설계로 함께 달성해야 하는 두 축이며, 에스컬레이션 로직은 그 접점에 놓인다.
신뢰성은 에스컬레이션의 짝이다. 에이전트가 언제 멈춰야 하는지를 알려면, 먼저 에이전트가 지금 무엇을 하고 있는지를 관찰할 수 있어야 한다. stop_reason, 토큰 사용량, 도구 호출 결과, 세션 상태 전이를 추적하지 못하는 시스템은 에스컬레이션 조건을 판정할 근거 자체가 없다. 이 장은 컨텍스트 관리와 신뢰성 도메인(시험 비중 15%)의 마지막 장으로, "왜 이 지점에서 사람에게 넘기는가"와 "그 판단을 가능하게 하는 신호를 어떻게 수집하는가"를 의사결정 중심으로 다룬다.
이 장을 마치면 되돌릴 수 없는 행동을 승인 게이트 뒤에 두는 에스컬레이션 로직을 설계하고, refusal·pause_turn·requires_action 같은 정지 신호를 올바르게 분기하며, 관찰성과 모니터링을 통해 에이전트의 신뢰성을 운영 수준에서 보장하는 아키텍처를 판단할 수 있다.
| 절 | 제목 | 핵심 내용 |
|---|---|---|
| 01 | 에스컬레이션 로직 설계 | 승인 게이트, 정지 신호 분기, human-in-the-loop, 되돌릴 수 없는 행동의 격리 |
| 02 | 신뢰성과 관찰성과 모니터링 | stop_reason 처리, 토큰·사용량 추적, 재시도와 백오프, 세션 이벤트와 웹훅 |