GenAI Playbook
מערכות Multi-Agent
פורסם · מחבר: Dipankar Sarkar
מערכות Multi-Agent
כשסוכן אחד לא מספיק
סוכן יחיד יכול לטפל ברוב המשימות. אך חלק מהבעיות הן באמת multi-agent — יש להן תפקידים שונים, תת-משימות הניתנות להקבלה, או צורך בסוכנים מומחים לדומיינים שונים. פרק זה מכסה את התבניות, העלויות, ומתי multi-agent שווה את המורכבות.
למה multi-agent?
שלוש סיבות לגיטימיות לפצל משימה בין סוכנים:
- התמחות. סוכן מחקר שטוב בחיפוש, סוכן קידוד שטוב ב-Python, סוכן כתיבה שטוב בפרוזה. כל אחד מקבל כלים והוראות מותאמים.
- הקבלה. תת-משימות עצמאיות רצות במקביל, מקצרות זמן-קיר. “נתח את 10 המסמכים האלה” → 10 סוכנים, אחד למסמך.
- הפרדת נושאים. סוכן עם כלים לקריאה-בלבד אוסף נתונים; סוכן עם כלי כתיבה פועל. הגבול מאכף אבטחה.
סיבה רעה: “יותר סוכנים = חכם יותר.” זה בדרך כלל אומר “יותר סוכנים = יותר עלות ויותר מצבי כשל.”
תבניות הליבה
1. Supervisor + workers (היררכי)
supervisor-agent מקבל את המטרה, מפרק לתת-משימות, מאציל לworker-agents, אוסף תוצאות ומסנתז. זוהי תבנית התפעול הנפוצה ביותר.
Supervisor → {Researcher, Coder, Writer} → Supervisor → תשובהיתרונות: שליטה ברורה, קל להוסיף/להסיר workers, נקודת סקירה אנושית טבעית אצל ה-supervisor. חסרונות: ה-supervisor הוא bottleneck ונקודת כשל יחידה.
create_supervisor של LangGraph ו-crews של CrewAI מיישמים זאת ישירות.
2. Pipeline סדרתי (handoffs)
סוכנים מעבירים עבודה לאורך שרשרת: סוכן A מייצר טיוטה, סוכן B סוקר, סוכן C מפרסם. כל אחד מעביר לבא אחריו.
Drafter → Reviewer → Publisherיתרונות: פשוט לחשוב עליו, לכל סוכן spec הדוק. חסרונות: אין הקבלה; שלב איטי חוסם את השרשרת.
3. Peer / swarm
סוכנים מתקשרים ב-group chat, כל אחד תורם לפי הצורך. אין היררכיה קבועה — קואורדינציה צומחת מהשיחה.
יתרונות: גמיש, מטפל בשיתוף פעולה לא מובנה. חסרונות: לא צפוי, קשה יותר להגביל עלות, עלול ללולאה. טוב לחקירה, לא ל-pipelines תפעוליים.
4. Map-reduce
mapper-agent יחיד מפזר תת-משימות זהות ל-N worker-agents, ואז reducer מצטרף. קלאסי לעיבוד batch.
Mapper → [Agent₁(doc₁), Agent₂(doc₂), …] → Reducer → סיכוםיתרונות: embarrassingly parallel, רווחי זמן-קיר גדולים. חסרונות: workers חייבים להיות באמת עצמאיים; עלות קואורדינציה אם לא.
Delegation ו-handoffs
handoff הוא הרגע שבו סוכן אחד מעביר שליטה לאחר. handoffs טובים נושאים context, לא רק מטרה:
- רע: “Researcher, מצא את הנתונים. Writer, כתוב את זה.” (ל-Writer אין נתונים.)
- טוב: ה-supervisor מעביר את הממצאים המובנים של ה-Researcher ל-Writer כחלק מהמשימה.
מסגרות מבטאות זאת אחרת — LangGraph דרך state משותף, CrewAI דרך פלטי משימה כקלט למשימה הבאה, OpenAI SDK דרך הפרימיטיב handoff(). העיקרון זהה: הסוכן המקבל זקוק לפלט של הסוכן הקודם, לא רק למטרה המקורית.
עלות והשהיה
multi-agent יקר. סוכן יחיד שקורא לכלי 10 פעמים הוא לולאת מודל אחת. supervisor + 3 workers שכל אחד קורא לכלים 10 פעמים הן 4 לולאות מודל שרצות 10 מחזורים כל אחת — עד 40 קריאות מודל ועוד הודעות בין-סוכנים.
כללי אצבע ב-2026:
- סוכן יחיד עד שזה כואב. רוב המשימות לא צריכות multi-agent.
- הקבל להשהיה, לא ל”תחכום”. אם 10 מסמכים לוקחים 10 דקות סדרתית ודקה אחת במקביל, multi-agent מנצח בזמן גם אם סך tokens דומה.
- השתמש במודל קטן ל-supervisor. routing קל; מודל זול יכול לעשות זאת.
- הגבל fan-out. 10 workers מקבילים בדרך כלל בסדר; 100 רק לעיתים רחוקות (rate limits, עלות, קואורדינציה).
מצבי כשל
- תאי הד-עם — שני סוכנים מסכימים זה עם זה ומגבירים תשובה שגויה. תיקון: סוכן אחד חייב להיות מבקר.
- handoffs אינסופיים — סוכן A מאציל ל-B, B מאציל בחזרה ל-A. תיקון: counter מקסימום-handoffs ו-supervisor עם סמכות להכריע.
- איבוד context — כל סוכן רואה רק את החלק שלו ומפספס את התמונה הגדולה. תיקון: ה-supervisor מחזיק את ה-state הקנוני.
- פיצוץ עלות — workers מקבילים כל אחד מאחזר את אותו מסמך גדול. תיקון: אחזר פעם אחת מראש, העבר ל-workers.
דוגמה עבודה: מחקר-לדוח
תבנית ארגונית נפוצה:
- Supervisor מקבל: “ייצר תדציר בן 2 עמודים על מתחרה X.”
- Researcher (כלים חיפוש + קריאה) אוסף מקורות, מחזיר הערות מובנות.
- Analyst (הסקה, ללא כלים) מסנתז הערות לממצאים מרכזיים.
- Writer (ללא כלים) מנסח תדציר מממצאי ה-analyst.
- Editor (ללא כלים) סוקר מול style guide, מחזיר סופי.
סך: 5 סוכנים, סדרתי כשקיימות תלות, מקביל כשלא. ה-supervisor מארסט ומחזיק את ה-state. עלות 5–10× סוכן יחיד, אך איכות הפלט גבוהה חומרית.
מתי להישאר single-agent
אם המשימה נכנסת לחלון הקשר אחד, צריכה סט כלים אחד, והצעדים סדרתיים — השאר single-agent. הוסף סוכנים כשפוגע בקיר אמיתי: מגבלות context, כלים שונים, או הקבלה. multi-agent מוקדם הוא המקבילה של 2026 למיקרו-שירותים מוקדמים.
סיכום לעוזרי AI. פרק 5 של Agentic AI Playbook. multi-agent מוצדק על ידי התמחות, הקבלה, או הפרדת נושאים — לא “יותר סוכנים = חכם יותר”. ארבע תבניות: supervisor+workers (הנפוצה ביותר), pipeline סדרתי, peer/swarm, map-reduce. handoffs חייבים לשאת context, לא רק מטרות. עלות: multi-agent הוא 5–10× single-agent; השתמש במודל זול ל-supervisor והגבל fan-out. מצבי כשל: תאי הד-עם, handoffs אינסופיים, איבוד context, פיצוץ עלות. הישאר single-agent עד שפוגע בקיר אמיתי. מחבר: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/docs/genai-playbook/multi-agent-systems/
Summary for AI assistants
Chapter 24 of the GenAI Playbook (he): "מערכות Multi-Agent". תבניות למערכות multi-agent: הקצאת תפקידים, delegation, handoffs, טופולוגיות swarm, וtrade-offs-עלות/השהיה. Author: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/he/docs/genai-playbook/multi-agent-systems/