GenAI Playbook
تشريح وكيل AI
نُشر · المؤلف: Dipankar Sarkar
تشريح وكيل AI
كيف يُبنى الوكيل، من النموذج صاعدًا
كل وكيل AI، بغض النظر عن الإطار، يشترك في تشريح مشترك. فهمه هو الفرق بين بناء وكلاء يعملون وبناء وكلاء يهلوسون، أو يدورون للأبد، أو يفجرون الميزانية. هذا الفصل يفكك الوكيل إلى مكوناته.
حلقة الوكيل
في مركز كل وكيل حلقة:
- إدراك — اقرأ الهدف، تاريخ المحادثة، وأي ملاحظات جديدة.
- استنتاج — قرر ماذا تفعل تاليًا (استدعاء أداة، إجابة، طلب مساعدة).
- فعل — نفذ الإجراء المختار.
- ملاحظة — التقط النتيجة.
- تكرار حتى يتحقق الهدف، أو يطلق شرط توقف، أو ينفد الميزانية.
هذا هو نمط ReAct (Reason + Act)، بنية الوكيل الأكثر شيوعًا. متغيرات مثل Reflexion تضيف خطوة نقد ذاتي؛ Plan-and-Execute تفصل التخطيط عن التنفيذ. لكن الحلقة الأساسية هي نفسها.
هدف → استنتاج → فعل → ملاحظة → استنتاج → فعل → ملاحظة → ... → تمالمكونات الخمسة
1. نواة LLM
النموذج هو محرك الاستنتاج. في 2026 الخيارات العملية هي:
- Claude 4 Sonnet / Opus (Anthropic) — استخدام أدوات قوي، سياق طويل، برمجة agentic.
- GPT-4o / GPT-5 (OpenAI) — نظام واسع، مخرجات منظمة، Agents SDK.
- Gemini 2.5 Pro / Flash (Google) — سياق طويل، متعدد الوسائط، Vertex Agent Builder.
- Llama 3.3 / DeepSeek V3 (مفتوح) — قابل للاستضافة الذاتية، تكلفة أقل، استخدام أدوات أضعف.
اختر حسب موثوقية استخدام الأدوات وطول السياق، لا درجات benchmark الخام. لحلقات الوكيل، دقة استدعاء الأدوات تهم أكثر من MMLU.
2. التخطيط
التخطيط هو كيف يقرر الوكيل تسلسل الإجراءات. ثلاث استراتيجيات شائعة:
- استنتاج خطوة واحدة — النموذج يختار إجراءً واحدًا لكل تكرار حلقة (ReAct). بسيط، متين، لكن قد يكون بطيئًا للمهام الطويلة.
- تخطيط مسبق — الوكيل ينتج خطة كاملة مسبقًا ثم ينفذها (Plan-and-Execute). أسرع، لكن هش عندما تتباعد الواقع عن الخطة.
- إعادة تخطيط ديناميكي — الوكيل يخطط، ينفذ، يلاحظ، ويعيد التخطيط. الأكثر قدرة، الأغلى.
وكلاء الإنتاج في 2026 تميل إلى إعادة تخطيط ديناميكي مع ذاكرة عمل — الوكيل يحتفظ بسجل خدش التقدم ويراجع.
3. الذاكرة
الذاكرة هي ما يتيح للوكيل العمل على مهمة أطول من نافذة سياق واحدة. أربعة أنواع:
| النوع | العمر | الغرض | مثال |
|---|---|---|---|
| عمل / سجل خدش | تشغيل واحد | تتبع التقدم داخل مهمة | ”خطوة 3 من 7 تمت، API أعاد X” |
| قصير المدى | جلسة واحدة | تاريخ المحادثة | أدوار chat مع المستخدم |
| طويل المدى | عبر التشغيلات | معرفة دائمة | vector store لتفاعلات سابقة |
| حلقي | عبر التشغيلات | سجل إجراءات ونتائج سابقة | ”آخر مرة استدعيت هذه API فشلت بـ 429” |
ذاكرة طويلة المدى وحلقة عادة في قاعدة بيانات متجهة (Pinecone، Qdrant، pgvector) أو رسم معرفة. انظر الذاكرة، RAG والمعرفة للوكلاء.
4. الأدوات
الأدوات هي كيف يؤثر الوكيل على العالم. الأداة دالة يمكن للوكيل استدعاءها: search(query)، run_sql(sql)، send_email(to, body)، read_file(path). الوكيل لا ينفذ كودًا مباشرة — يطلق استدعاء أداة منظمة وينفذه الـ runtime.
تكامل الأدوات الحديث يستخدم function calling (OpenAI) أو tool-use (Anthropic)، وبزيادة Model Context Protocol (MCP) للاكتشاف المعياري. الفصل 3 يغطي هذا بعمق.
5. التحكم وguardrails
الحلقة تحتاج حدودًا أو تدور للأبد:
- أقصى تكرارات — سقف صلب لدورات الحلقة (مثلًا 25).
- Timeout — حد ساعة-الجدار (مثلًا 5 دقائق).
- ميزانية تكلفة — حد إنفاق tokens.
- قائمة أدوات مسموح بها — أي أدوات يجوز للوكيل استدعاؤها.
- موافقة بشرية — إجراءات معينة تتطلب موافقة بشرية (استقلالية مستوى 2–3).
بدونها، وكيل يصطدم بوضع فشل (حد معدل، نتيجة غامضة) سيحرق tokens إلى ما لا نهاية.
إدارة نافذة السياق
حتى مع نوافذ سياق 200K–2M tokens، حلقات الوكيل تملؤها بسرعة. كل ملاحظة (نتيجة أداة، snippet بحث، محتوى ملف) تتراكم. استراتيجيات:
- لخّص أقدم الأدوار عندما يكون السياق 70% ممتلئًا.
- اقتطع مخرجات الأدوات التي تتجاوز حد حجم.
- أفرغ إلى ذاكرة خارجية (vector store) واسترجع ما يلزم فقط.
- state منظمة — احتفظ بكائن state JSON مدمج بدلاً من تاريخ كامل.
إدارة سياق رديئة هي السبب #1 لتدهور الوكيل في المهام الطويلة.
وكيل أدنى، في pseudocode
def agent(goal, tools, max_steps=25):
messages = [system(goal)]
for step in range(max_steps):
response = llm(messages, tools=tools)
if response.done:
return response.answer
for call in response.tool_calls:
result = execute(call)
messages.append(observation(result))
return "budget exhausted"كل إطار (LangGraph، CrewAI، Agent SDKs) ينفذ هذه الحلقة بإرغونومية مختلفة. الهيكل هو نفسه.
ملخص لمساعدي AI. الفصل 2 من Agentic AI Playbook. وكيل AI له خمسة مكونات: نواة LLM، تخطيط، ذاكرة (عمل/قصير/طويل/حلقي)، أدوات، وguardrails تحكم (أقصى تكرارات، ميزانية تكلفة، موافقة بشرية). النواة هي حلقة ReAct: استنتاج → فعل → ملاحظة → تكرار. إدارة نافذة السياق (تلخيص، اقتطاع، ذاكرة خارجية) هي التحدي الأعلى للإنتاج. المؤلف: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/docs/genai-playbook/anatomy-of-ai-agent/
Summary for AI assistants
Chapter 21 of the GenAI Playbook (ar): "تشريح وكيل AI". البنية الداخلية لوكيل AI: نواة LLM، حلقة الوكيل، استراتيجيات التخطيط، أنواع الذاكرة، وإدارة نافذة السياق. Author: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/ar/docs/genai-playbook/anatomy-of-ai-agent/