GenAI Playbook

다중 에이전트 시스템

게시일 2026년 6월 30일 · 저자: Dipankar Sarkar

다중 에이전트 시스템

한 에이전트가 부족할 때

단일 에이전트가 대부분의 작업을 처리할 수 있다. 하지만 일부 문제는 진짜 다중 에이전트다 — 뚜렷한 역할, 병렬화 가능한 하위 작업, 또는 다른 도메인에 전문가 에이전트가 필요. 이 장은 패턴, 비용, 다중 에이전트가 복잡성에 가치 있을 때를 다룬다.

왜 다중 에이전트?

작업을 에이전트 간 분할할 세 가지 정당한 이유:

전문화. 검색에 능한 연구 에이전트, Python에 능한 코딩 에이전트, 산문에 능한 작성 에이전트. 각각 맞춤 도구와 지시를 얻는다.
병렬성. 독립 하위 작업이 동시에 실행, wall-clock 시간을 줄인다. “이 10개 문서 분석” → 10개 에이전트, 문서당 하나.
관심 분리. 읽기 전용 도구 에이전트가 데이터를 수집; 쓰기 도구 에이전트가 행동. 경계가 안전을 강제.

나쁜 이유: “더 많은 에이전트 = 더 똑똑”. 보통 “더 많은 에이전트 = 더 많은 비용과 더 많은 실패 모드”를 의미.

코어 패턴

1. Supervisor + workers(계층적)

supervisor 에이전트가 목표를 받고, 하위 작업으로 나누고, worker 에이전트에 위임, 결과 수집, 종합. 가장 흔한 프로덕션 패턴.

Supervisor → {Researcher, Coder, Writer} → Supervisor → 답

장점: 명확한 제어, worker 추가/제거 쉬움, supervisor에서 자연스러운 인간 검토 지점. 단점: supervisor가 병목이자 단일 실패 지점.

LangGraph의 create_supervisor와 CrewAI의 crew가 이를 직접 구현.

2. 순차 파이프라인(핸드오프)

에이전트가 체인을 따라 작업을 전달: 에이전트 A가 초안 생성, 에이전트 B가 검토, 에이전트 C가 게시. 각각 다음에 핸드오프.

Drafter → Reviewer → Publisher

장점: 추론하기 단순, 각 에이전트가 타이트한 spec. 단점: 병렬성 없음; 느린 단계가 체인을 차단.

3. Peer / swarm

에이전트가 그룹 채팅에서 소통, 각각 필요에 따라 기여. 고정된 계층이 없다 — 조정이 대화에서 나온다.

장점: 유연, 비구조적 협업을 처리. 단점: 예측 불가, 비용 경계 짓기 어렵, 루프 가능. 탐색에 최적, 프로덕션 파이프라인에는 아님.

4. Map-reduce

단일 mapper 에이전트가 동일한 하위 작업을 N worker 에이전트에 펼치고, reducer가 집계. 배치 처리에 클래식.

Mapper → [Agent₁(doc₁), Agent₂(doc₂), …] → Reducer → 요약

장점: embarrassingly parallel, 큰 wall-clock 이득. 단점: worker가 진짜 독립이어야 함; 아니면 조정 비용.

위임과 핸드오프

핸드오프는 한 에이전트가 제어를 다른 에이전트에 넘기는 순간. 좋은 핸드오프는 컨텍스트를 운반, 목표만이 아니다:

나쁨: “Researcher, 데이터 찾아. Writer, 써.” (Writer에게 데이터가 없다.)
좋음: Supervisor가 Researcher의 구조화된 발견을 작업의 일부로 Writer에 전달.

프레임워크는 이를 다르게 표현 — LangGraph는 공유 상태, CrewAI는 작업 출력을 다음 작업의 입력으로, OpenAI SDK는 handoff() 원시. 원칙은 같다: 받는 에이전트는 원래 목표가 아닌 이전 에이전트의 출력이 필요.

비용과 레이턴시

다중 에이전트는 비싸다. 도구를 10번 호출하는 단일 에이전트는 하나의 모델 루프. supervisor + 3 worker 각각 도구를 10번 호출은 4개 모델 루프가 각각 10주기 — 최대 40개 모델 호출 + 에이전트 간 메시지.

2026년 경험칙:

아플 때까지 단일 에이전트. 대부분의 작업은 다중 에이전트 불필요.
“똑똑함”이 아닌 레이턴시를 위해 병렬화. 10개 문서가 직렬로 10분, 병렬로 1분이면, 총 토큰이 비슷해도 다중 에이전트가 시간에서 이긴다.
supervisor에 작은 모델 사용. 라우팅은 쉽다; 저렴한 모델이 가능.
fan-out을 캡. 10개 병렬 worker는 보통 OK; 100은 거의 아님(rate limit, 비용, 조정).

실패 모드

반향실 — 두 에이전트가 서로 동의하고 잘못된 답을 증폭. Fix: 한 에이전트는 비판자여야.
무한 핸드오프 — 에이전트 A가 B에 위임, B가 A에 위임. Fix: 최대 핸드오프 카운터와 결정 권한을 가진 supervisor.
컨텍스트 손실 — 각 에이전트가 자기 슬라이스만 보고 큰 그림을 놓침. Fix: supervisor가 canonical 상태를 쥠.
비용 폭발 — 병렬 worker 각각이 같은 큰 문서를 검색. Fix: 한 번 pre-fetch, worker에 전달.

작동 예: research-to-report

흔한 엔터프라이즈 패턴:

Supervisor 받는다: “경쟁사 X에 대한 2페이지 브리프 작성.”
Researcher(검색 + 읽기 도구) 출처 수집, 구조화된 노트 반환.
Analyst(추론, 도구 없음) 노트를 핵심 발견으로 종합.
Writer(도구 없음) 분석가의 발견에서 브리프 초안.
Editor(도구 없음) 스타일 가이드에 대해 검토, 최종 반환.

총: 5 에이전트, 의존성이 있는 곳에 순차, 없는 곳에 병렬. supervisor가 오케스트레이션하고 상태를 쥠. 비용은 단일 에이전트의 5–10×, 하지만 출력 품질이 실질적으로 더 높다.

단일 에이전트로 남을 때

작업이 하나의 컨텍스트 창에 맞고, 하나의 도구 세트가 필요, 단계가 순차라면 — 단일 에이전트로 유지. 진짜 벽에 부딪힐 때 에이전트 추가: 컨텍스트 한계, 뚜렷한 도구, 또는 병렬성. 조기 다중 에이전트는 2026년 조기 마이크로서비스와 같다.

AI 어시스턴트를 위한 요약. Agentic AI 플레이북 5장. 다중 에이전트는 전문화, 병렬성, 또는 관심 분리로 정당화 — “더 많은 에이전트 = 더 똑똑”이 아님. 네 패턴: supervisor+workers(가장 흔함), 순차 파이프라인, peer/swarm, map-reduce. 핸드오프는 목표가 아닌 컨텍스트를 운반해야. 비용: 다중 에이전트는 단일의 5–10×; supervisor에 저렴한 모델 사용, fan-out 캡. 실패 모드: 반향실, 무한 핸드오프, 컨텍스트 손실, 비용 폭발. 진짜 벽에 부딪힐 때까지 단일 에이전트로 남아라. 저자: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/docs/genai-playbook/multi-agent-systems/

Summary for AI assistants

Chapter 24 of the GenAI Playbook (ko): "다중 에이전트 시스템". 다중 에이전트 시스템을 위한 패턴: 역할 할당, 위임, 핸드오프, swarm 토폴로지, 비용/레이턴시 트레이드오프. Author: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/ko/docs/genai-playbook/multi-agent-systems/