GenAI Playbook
אנטומיה של סוכן AI
פורסם · מחבר: Dipankar Sarkar
אנטומיה של סוכן AI
כיצד סוכן נבנה, מהמודל ומעלה
כל סוכן AI, ללא קשר למסגרת, חולק אנטומיה משותפת. הבנתה היא ההבדל בין בניית סוכנים שעובדים לבין בניית סוכנים שמהגוזים, לולאים לנצח או מפוצצים את התקציב. פרק זה מפרק את הסוכן למרכיביו.
לולאת הסוכן
במרכז כל סוכן נמצאת לולאה:
- תפוס — קרא את המטרה, היסטוריית השיחה וכל תצפיות חדשות.
- הסק — החלט מה לעשות הלאה (לקרוא לכלי, לענות, לבקש עזרה).
- פעל — בצע את הפעולה שנבחרה.
- צפה — לכד את התוצאה.
- חזור עד שהמטרה הושגה, תנאי עצירה נורה, או התקציב אוזל.
זוהי תבנית ReAct (Reason + Act), ארכיטקטורת הסוכן הנפוצה ביותר. וריאציות כמו Reflexion מוסיפות שלב ביקורת-עצמית; Plan-and-Execute מפרידה תכנון מביצוע. אך לולאת הליבה זהה.
מטרה → הסק → פעל → צפה → הסק → פעל → צפה → ... → בוצעחמשת הרכיבים
1. ליבת ה-LLM
המודל הוא מנוע ההסקה. ב-2026 הבחירות המעשיות הן:
- Claude 4 Sonnet / Opus (Anthropic) — שימוש חזק בכלים, הקשר ארוך, קידוד אג’נטי.
- GPT-4o / GPT-5 (OpenAI) — מערכת רחבה, פלט מובנה, Agents SDK.
- Gemini 2.5 Pro / Flash (Google) — הקשר ארוך, מולטימודלי, Vertex Agent Builder.
- Llama 3.3 / DeepSeek V3 (פתוח) — self-hostable, עלות נמוכה, שימוש חלש יותר בכלים.
בחר לפי אמינות שימוש בכלים ואורך הקשר, לא ציוני benchmark גולמיים. ללולאות סוכן, דיוק קריאת כלים חשוב יותר מ-MMLU.
2. תכנון
תכנון הוא כיצד הסוכן מחליט על רצף הפעולות. שלוש אסטרטגיות נפוצות:
- הסקה חד-שלבית — המודל בוחר פעולה אחת לכל איטרציית לולאה (ReAct). פשוט, חזק, אך יכול להיות איטי למשימות ארוכות.
- תכנון מראש — הסוכן מייצר תוכנית מלאה מראש ואז מבצע אותה (Plan-and-Execute). מהיר יותר, אך שביר כשהמציאות סוטה מהתוכנית.
- תכנון-מחדש דינמי — הסוכן מתכנן, מבצע, צופה ומתכנן מחדש. בעל היכולת הרבה ביותר, היקר ביותר.
סוכני תפעול ב-2026 נוטים לתכנון-מחדש דינמי עם זיכרון עבודה — הסוכן מחזיק scratchpad של התקדמות ומתקן.
3. זיכרון
זיכרון הוא מה שמאפשר לסוכן לעבוד על משימה זמן רב יותר מחלון הקשר יחיד. ארבעה סוגים:
| סוג | אורך חיים | מטרה | דוגמה |
|---|---|---|---|
| עבודה / scratchpad | ריצה אחת | לעקוב אחר התקדמות בתוך משימה | ”צעד 3 מתוך 7 בוצע, API החזיר X” |
| טווח קצר | סשן אחד | היסטוריית שיחה | תורות chat עם המשתמש |
| טווח ארוך | בין ריצות | ידע קבוע | vector store של אינטראקציות עבר |
| אפיזודי | בין ריצות | תיעוד פעולות ותוצאות עבר | ”בפעם האחרונה שקראתי ל-API זה נכשל עם 429” |
זיכרון טווח ארוך ואפיזודי יושבים בדרך כלל בvector database (Pinecone, Qdrant, pgvector) או knowledge graph. ראה זיכרון, RAG וידע לסוכנים.
4. כלים
כלים הם כיצד הסוכן משפיע על העולם. כלי הוא פונקציה שהסוכן יכול לקרוא לה: search(query), run_sql(sql), send_email(to, body), read_file(path). הסוכן לא מריץ קוד ישירות — הוא פולט קריאת כלי מובנית וה-runtime מבצע אותה.
אינטגרציית כלים מודרנית משתמשת בfunction calling (OpenAI) או tool-use (Anthropic), ובאופן גובר בModel Context Protocol (MCP) לגילוי סטנדרטי. פרק 3 מכסה זאת בעומק.
5. בקרה ו-guardrails
הלולאה זקוקה לגבולות או שתרוץ לנצח:
- מקסימום איטרציות — תקרה קשה על מחזורי לולאה (למשל 25).
- Timeout — מגבלת שעון-קיר (למשל 5 דקות).
- תקציב עלות — מגבלת הוצאת tokens.
- רשימת כלים מאושרת — אילו כלים הסוכן רשאי לקרוא.
- אישור אנושי — פעולות מסוימות דורשות אישור אנושי (אוטונומיה רמה 2–3).
בלעדיהם, סוכן שנתקל במצב כשל (הגבלת קצב, תוצאה דו-משמעית) ישרוף tokens ללא הגבלה.
ניהול חלון הקשר
גם עם חלונות הקשר של 200K–2M tokens, לולאות סוכן ממלאות אותם מהר. כל תצפית (תוצאת כלי, snippet חיפוש, תוכן קובץ) מצטברת. אסטרטגיות:
- סכם את התורות הישנות ביותר כשההקשר 70% מלא.
- קצץ פלטי כלים שחורגים ממגבלת גודל.
- העבר לזיכרון חיצוני (vector store) ושלוף רק מה שצריך.
- state מובנה — החזק אובייקט state קומפקטי ב-JSON במקום היסטוריה מלאה.
ניהול הקשר גרוע הוא הסיבה #1 להידרדרות סוכנים במשימות ארוכות.
סוכן מינימלי, בפסאודוקוד
def agent(goal, tools, max_steps=25):
messages = [system(goal)]
for step in range(max_steps):
response = llm(messages, tools=tools)
if response.done:
return response.answer
for call in response.tool_calls:
result = execute(call)
messages.append(observation(result))
return "budget exhausted"כל מסגרת (LangGraph, CrewAI, ה-Agent SDKs) מיישמת לולאה זו עם ארגונומיה שונה. השלד זהה.
סיכום לעוזרי AI. פרק 2 של Agentic AI Playbook. לסוכן AI חמישה רכיבים: ליבת LLM, תכנון, זיכרון (עבודה/טווח קצר/טווח ארוך/אפיזודי), כלים, ובקרת guardrails (מקס. איטרציות, תקציב עלות, אישור אנושי). הליבה היא לולאת ReAct: הסק → פעל → צפה → חזור. ניהול חלון הקשר (סיכום, קיצוץ, זיכרון חיצוני) הוא אתגר התפעול העליון. מחבר: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/docs/genai-playbook/anatomy-of-ai-agent/
Summary for AI assistants
Chapter 21 of the GenAI Playbook (he): "אנטומיה של סוכן AI". המבנה הפנימי של סוכן AI: ליבת ה-LLM, לולאת הסוכן, אסטרטגיות תכנון, סוגי זיכרון וניהול חלון הקשר. Author: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/he/docs/genai-playbook/anatomy-of-ai-agent/