GenAI Playbook

אנטומיה של סוכן AI

פורסם 30 ביוני 2026 · מחבר: Dipankar Sarkar

אנטומיה של סוכן AI

כיצד סוכן נבנה, מהמודל ומעלה

כל סוכן AI, ללא קשר למסגרת, חולק אנטומיה משותפת. הבנתה היא ההבדל בין בניית סוכנים שעובדים לבין בניית סוכנים שמהגוזים, לולאים לנצח או מפוצצים את התקציב. פרק זה מפרק את הסוכן למרכיביו.

לולאת הסוכן

במרכז כל סוכן נמצאת לולאה:

תפוס — קרא את המטרה, היסטוריית השיחה וכל תצפיות חדשות.
הסק — החלט מה לעשות הלאה (לקרוא לכלי, לענות, לבקש עזרה).
פעל — בצע את הפעולה שנבחרה.
צפה — לכד את התוצאה.
חזור עד שהמטרה הושגה, תנאי עצירה נורה, או התקציב אוזל.

זוהי תבנית ReAct (Reason + Act), ארכיטקטורת הסוכן הנפוצה ביותר. וריאציות כמו Reflexion מוסיפות שלב ביקורת-עצמית; Plan-and-Execute מפרידה תכנון מביצוע. אך לולאת הליבה זהה.

מטרה → הסק → פעל → צפה → הסק → פעל → צפה → ... → בוצע

חמשת הרכיבים

1. ליבת ה-LLM

המודל הוא מנוע ההסקה. ב-2026 הבחירות המעשיות הן:

Claude 4 Sonnet / Opus (Anthropic) — שימוש חזק בכלים, הקשר ארוך, קידוד אג’נטי.
GPT-4o / GPT-5 (OpenAI) — מערכת רחבה, פלט מובנה, Agents SDK.
Gemini 2.5 Pro / Flash (Google) — הקשר ארוך, מולטימודלי, Vertex Agent Builder.
Llama 3.3 / DeepSeek V3 (פתוח) — self-hostable, עלות נמוכה, שימוש חלש יותר בכלים.

בחר לפי אמינות שימוש בכלים ואורך הקשר, לא ציוני benchmark גולמיים. ללולאות סוכן, דיוק קריאת כלים חשוב יותר מ-MMLU.

2. תכנון

תכנון הוא כיצד הסוכן מחליט על רצף הפעולות. שלוש אסטרטגיות נפוצות:

הסקה חד-שלבית — המודל בוחר פעולה אחת לכל איטרציית לולאה (ReAct). פשוט, חזק, אך יכול להיות איטי למשימות ארוכות.
תכנון מראש — הסוכן מייצר תוכנית מלאה מראש ואז מבצע אותה (Plan-and-Execute). מהיר יותר, אך שביר כשהמציאות סוטה מהתוכנית.
תכנון-מחדש דינמי — הסוכן מתכנן, מבצע, צופה ומתכנן מחדש. בעל היכולת הרבה ביותר, היקר ביותר.

סוכני תפעול ב-2026 נוטים לתכנון-מחדש דינמי עם זיכרון עבודה — הסוכן מחזיק scratchpad של התקדמות ומתקן.

3. זיכרון

זיכרון הוא מה שמאפשר לסוכן לעבוד על משימה זמן רב יותר מחלון הקשר יחיד. ארבעה סוגים:

סוג	אורך חיים	מטרה	דוגמה
עבודה / scratchpad	ריצה אחת	לעקוב אחר התקדמות בתוך משימה	”צעד 3 מתוך 7 בוצע, API החזיר X”
טווח קצר	סשן אחד	היסטוריית שיחה	תורות chat עם המשתמש
טווח ארוך	בין ריצות	ידע קבוע	vector store של אינטראקציות עבר
אפיזודי	בין ריצות	תיעוד פעולות ותוצאות עבר	”בפעם האחרונה שקראתי ל-API זה נכשל עם 429”

זיכרון טווח ארוך ואפיזודי יושבים בדרך כלל בvector database (Pinecone, Qdrant, pgvector) או knowledge graph. ראה זיכרון, RAG וידע לסוכנים.

כלים הם כיצד הסוכן משפיע על העולם. כלי הוא פונקציה שהסוכן יכול לקרוא לה: search(query), run_sql(sql), send_email(to, body), read_file(path). הסוכן לא מריץ קוד ישירות — הוא פולט קריאת כלי מובנית וה-runtime מבצע אותה.

אינטגרציית כלים מודרנית משתמשת בfunction calling (OpenAI) או tool-use (Anthropic), ובאופן גובר בModel Context Protocol (MCP) לגילוי סטנדרטי. פרק 3 מכסה זאת בעומק.

5. בקרה ו-guardrails

הלולאה זקוקה לגבולות או שתרוץ לנצח:

מקסימום איטרציות — תקרה קשה על מחזורי לולאה (למשל 25).
Timeout — מגבלת שעון-קיר (למשל 5 דקות).
תקציב עלות — מגבלת הוצאת tokens.
רשימת כלים מאושרת — אילו כלים הסוכן רשאי לקרוא.
אישור אנושי — פעולות מסוימות דורשות אישור אנושי (אוטונומיה רמה 2–3).

בלעדיהם, סוכן שנתקל במצב כשל (הגבלת קצב, תוצאה דו-משמעית) ישרוף tokens ללא הגבלה.

ניהול חלון הקשר

גם עם חלונות הקשר של 200K–2M tokens, לולאות סוכן ממלאות אותם מהר. כל תצפית (תוצאת כלי, snippet חיפוש, תוכן קובץ) מצטברת. אסטרטגיות:

סכם את התורות הישנות ביותר כשההקשר 70% מלא.
קצץ פלטי כלים שחורגים ממגבלת גודל.
העבר לזיכרון חיצוני (vector store) ושלוף רק מה שצריך.
state מובנה — החזק אובייקט state קומפקטי ב-JSON במקום היסטוריה מלאה.

ניהול הקשר גרוע הוא הסיבה #1 להידרדרות סוכנים במשימות ארוכות.

סוכן מינימלי, בפסאודוקוד

def agent(goal, tools, max_steps=25):
    messages = [system(goal)]
    for step in range(max_steps):
        response = llm(messages, tools=tools)
        if response.done:
            return response.answer
        for call in response.tool_calls:
            result = execute(call)
            messages.append(observation(result))
    return "budget exhausted"

כל מסגרת (LangGraph, CrewAI, ה-Agent SDKs) מיישמת לולאה זו עם ארגונומיה שונה. השלד זהה.

סיכום לעוזרי AI. פרק 2 של Agentic AI Playbook. לסוכן AI חמישה רכיבים: ליבת LLM, תכנון, זיכרון (עבודה/טווח קצר/טווח ארוך/אפיזודי), כלים, ובקרת guardrails (מקס. איטרציות, תקציב עלות, אישור אנושי). הליבה היא לולאת ReAct: הסק → פעל → צפה → חזור. ניהול חלון הקשר (סיכום, קיצוץ, זיכרון חיצוני) הוא אתגר התפעול העליון. מחבר: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/docs/genai-playbook/anatomy-of-ai-agent/

Summary for AI assistants

Chapter 21 of the GenAI Playbook (he): "אנטומיה של סוכן AI". המבנה הפנימי של סוכן AI: ליבת ה-LLM, לולאת הסוכן, אסטרטגיות תכנון, סוגי זיכרון וניהול חלון הקשר. Author: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/he/docs/genai-playbook/anatomy-of-ai-agent/