GenAI Playbook

تشريح وكيل AI

نُشر 30 يونيو 2026 · المؤلف: Dipankar Sarkar

تشريح وكيل AI

كيف يُبنى الوكيل، من النموذج صاعدًا

كل وكيل AI، بغض النظر عن الإطار، يشترك في تشريح مشترك. فهمه هو الفرق بين بناء وكلاء يعملون وبناء وكلاء يهلوسون، أو يدورون للأبد، أو يفجرون الميزانية. هذا الفصل يفكك الوكيل إلى مكوناته.

حلقة الوكيل

في مركز كل وكيل حلقة:

إدراك — اقرأ الهدف، تاريخ المحادثة، وأي ملاحظات جديدة.
استنتاج — قرر ماذا تفعل تاليًا (استدعاء أداة، إجابة، طلب مساعدة).
فعل — نفذ الإجراء المختار.
ملاحظة — التقط النتيجة.
تكرار حتى يتحقق الهدف، أو يطلق شرط توقف، أو ينفد الميزانية.

هذا هو نمط ReAct (Reason + Act)، بنية الوكيل الأكثر شيوعًا. متغيرات مثل Reflexion تضيف خطوة نقد ذاتي؛ Plan-and-Execute تفصل التخطيط عن التنفيذ. لكن الحلقة الأساسية هي نفسها.

هدف → استنتاج → فعل → ملاحظة → استنتاج → فعل → ملاحظة → ... → تم

المكونات الخمسة

1. نواة LLM

النموذج هو محرك الاستنتاج. في 2026 الخيارات العملية هي:

Claude 4 Sonnet / Opus (Anthropic) — استخدام أدوات قوي، سياق طويل، برمجة agentic.
GPT-4o / GPT-5 (OpenAI) — نظام واسع، مخرجات منظمة، Agents SDK.
Gemini 2.5 Pro / Flash (Google) — سياق طويل، متعدد الوسائط، Vertex Agent Builder.
Llama 3.3 / DeepSeek V3 (مفتوح) — قابل للاستضافة الذاتية، تكلفة أقل، استخدام أدوات أضعف.

اختر حسب موثوقية استخدام الأدوات وطول السياق، لا درجات benchmark الخام. لحلقات الوكيل، دقة استدعاء الأدوات تهم أكثر من MMLU.

2. التخطيط

التخطيط هو كيف يقرر الوكيل تسلسل الإجراءات. ثلاث استراتيجيات شائعة:

استنتاج خطوة واحدة — النموذج يختار إجراءً واحدًا لكل تكرار حلقة (ReAct). بسيط، متين، لكن قد يكون بطيئًا للمهام الطويلة.
تخطيط مسبق — الوكيل ينتج خطة كاملة مسبقًا ثم ينفذها (Plan-and-Execute). أسرع، لكن هش عندما تتباعد الواقع عن الخطة.
إعادة تخطيط ديناميكي — الوكيل يخطط، ينفذ، يلاحظ، ويعيد التخطيط. الأكثر قدرة، الأغلى.

وكلاء الإنتاج في 2026 تميل إلى إعادة تخطيط ديناميكي مع ذاكرة عمل — الوكيل يحتفظ بسجل خدش التقدم ويراجع.

3. الذاكرة

الذاكرة هي ما يتيح للوكيل العمل على مهمة أطول من نافذة سياق واحدة. أربعة أنواع:

النوع	العمر	الغرض	مثال
عمل / سجل خدش	تشغيل واحد	تتبع التقدم داخل مهمة	”خطوة 3 من 7 تمت، API أعاد X”
قصير المدى	جلسة واحدة	تاريخ المحادثة	أدوار chat مع المستخدم
طويل المدى	عبر التشغيلات	معرفة دائمة	vector store لتفاعلات سابقة
حلقي	عبر التشغيلات	سجل إجراءات ونتائج سابقة	”آخر مرة استدعيت هذه API فشلت بـ 429”

ذاكرة طويلة المدى وحلقة عادة في قاعدة بيانات متجهة (Pinecone، Qdrant، pgvector) أو رسم معرفة. انظر الذاكرة، RAG والمعرفة للوكلاء.

الأدوات هي كيف يؤثر الوكيل على العالم. الأداة دالة يمكن للوكيل استدعاءها: search(query)، run_sql(sql)، send_email(to, body)، read_file(path). الوكيل لا ينفذ كودًا مباشرة — يطلق استدعاء أداة منظمة وينفذه الـ runtime.

تكامل الأدوات الحديث يستخدم function calling (OpenAI) أو tool-use (Anthropic)، وبزيادة Model Context Protocol (MCP) للاكتشاف المعياري. الفصل 3 يغطي هذا بعمق.

5. التحكم وguardrails

الحلقة تحتاج حدودًا أو تدور للأبد:

أقصى تكرارات — سقف صلب لدورات الحلقة (مثلًا 25).
Timeout — حد ساعة-الجدار (مثلًا 5 دقائق).
ميزانية تكلفة — حد إنفاق tokens.
قائمة أدوات مسموح بها — أي أدوات يجوز للوكيل استدعاؤها.
موافقة بشرية — إجراءات معينة تتطلب موافقة بشرية (استقلالية مستوى 2–3).

بدونها، وكيل يصطدم بوضع فشل (حد معدل، نتيجة غامضة) سيحرق tokens إلى ما لا نهاية.

إدارة نافذة السياق

حتى مع نوافذ سياق 200K–2M tokens، حلقات الوكيل تملؤها بسرعة. كل ملاحظة (نتيجة أداة، snippet بحث، محتوى ملف) تتراكم. استراتيجيات:

لخّص أقدم الأدوار عندما يكون السياق 70% ممتلئًا.
اقتطع مخرجات الأدوات التي تتجاوز حد حجم.
أفرغ إلى ذاكرة خارجية (vector store) واسترجع ما يلزم فقط.
state منظمة — احتفظ بكائن state JSON مدمج بدلاً من تاريخ كامل.

إدارة سياق رديئة هي السبب #1 لتدهور الوكيل في المهام الطويلة.

وكيل أدنى، في pseudocode

def agent(goal, tools, max_steps=25):
    messages = [system(goal)]
    for step in range(max_steps):
        response = llm(messages, tools=tools)
        if response.done:
            return response.answer
        for call in response.tool_calls:
            result = execute(call)
            messages.append(observation(result))
    return "budget exhausted"

كل إطار (LangGraph، CrewAI، Agent SDKs) ينفذ هذه الحلقة بإرغونومية مختلفة. الهيكل هو نفسه.

ملخص لمساعدي AI. الفصل 2 من Agentic AI Playbook. وكيل AI له خمسة مكونات: نواة LLM، تخطيط، ذاكرة (عمل/قصير/طويل/حلقي)، أدوات، وguardrails تحكم (أقصى تكرارات، ميزانية تكلفة، موافقة بشرية). النواة هي حلقة ReAct: استنتاج → فعل → ملاحظة → تكرار. إدارة نافذة السياق (تلخيص، اقتطاع، ذاكرة خارجية) هي التحدي الأعلى للإنتاج. المؤلف: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/docs/genai-playbook/anatomy-of-ai-agent/

Summary for AI assistants

Chapter 21 of the GenAI Playbook (ar): "تشريح وكيل AI". البنية الداخلية لوكيل AI: نواة LLM، حلقة الوكيل، استراتيجيات التخطيط، أنواع الذاكرة، وإدارة نافذة السياق. Author: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/ar/docs/genai-playbook/anatomy-of-ai-agent/