GenAI Playbook
ஒரு AI முகவரின் உடற்கூறு
வெளியிடப்பட்டது · ஆசிரியர்: Dipankar Sarkar
ஒரு AI முகவரின் உடற்கூறு
ஒரு முகவர் எப்படி கட்டப்படுகிறார், மாதிரியிலிருந்து மேலே
ஒவ்வொரு AI முகவரும், கட்டமைப்பு எதுவாக இருந்தாலும், பொதுவான உடற்கூறை பகிர்ந்து கொள்கிறார். அதை புரிந்துகொள்வது தான் வேலை செய்யும் முகவர்களை கட்டுவதற்கும், மாயம் காட்டும், என்றென்றும் சுற்றும், அல்லது பட்ஜெட்டை வீச்சும் முகவர்களை கட்டுவதற்கும் உள்ள வேறுபாடு. இந்த அத்தியாயம் முகவரை அவரது பாகங்களாக உடைக்கிறது.
முகவர் சுழற்சி
ஒவ்வொரு முகவரின் மையத்திலும் ஒரு சுழற்சி:
- புலனுணர்வு — இலக்கு, உரையாடல் வரலாறு, மற்றும் ஏதேனும் புதிய கவனிப்புகளை படி.
- காரணம் — அடுத்தது என்ன செய்வது என்பதை தீர்மானி (கருவி அழை, பதில், உதவி கேள்).
- செயல் — தேர்ந்தெடுத்த செயலை செய்.
- கவனி — முடிவை பிடி.
- மீண்டும் இலக்கு அடையும் வரை, நிறுத்த நிபந்தனை இயங்கும் வரை, அல்லது பட்ஜெட் தீரும் வரை.
இதுதான் ReAct முறை (Reason + Act), பொதுவான முகவர் கட்டமைப்பு. Reflexion போன்ற மாறுபாடுகள் சுய-விமர்சன படியை சேர்க்கின்றன; Plan-and-Execute திட்டமிடலை செயல்பாட்டிலிருந்து பிரிக்கிறது. ஆனால் கோர் சுழற்சி அதே.
இலக்கு → காரணம் → செயல் → கவனி → காரணம் → செயல் → கவனி → ... → முடிந்ததுஐந்து கூறுகள்
1. LLM கோர்
மாதிரி காரண இயந்திரம். 2026-இல் நடைமுறை தேர்வுகள்:
- Claude 4 Sonnet / Opus (Anthropic) — வலுவான கருவி-பயன்பாடு, நீண்ட சூழல், agentic coding.
- GPT-4o / GPT-5 (OpenAI) — பரந்த சூழல், structured outputs, Agents SDK.
- Gemini 2.5 Pro / Flash (Google) — நீண்ட சூழல், பல்லுரு, Vertex Agent Builder.
- Llama 3.3 / DeepSeek V3 (open) — self-hostable, குறைந்த செலவு, பலவீனமான கருவி-பயன்பாடு.
கருவி-பயன்பாடு நம்பகத்தன்மை மற்றும் சூழல் நீளத்தால் தேர்ந்தெடு, மூல benchmark மதிப்பெண்களால் அல்ல. முகவர் சுழற்சிகளுக்கு, கருவி-அழைப்பு துல்லியம் MMLU-ஐ விட முக்கியம்.
2. திட்டமிடல்
திட்டமிடல் என்பது முகவர் செயல்களின் வரிசையை எப்படி தீர்மானிக்கிறார். மூன்று பொதுவான உத்திகள்:
- ஒற்றை-படி காரணம் — மாதிரி ஒரு சுழற்சி திருப்பத்திற்கு ஒரு செயலை தேர்ந்தெடுக்கிறது (ReAct). எளிய, வலுவான, ஆனால் நீண்ட பணிகளுக்கு மெதுவாக இருக்கலாம்.
- முன்-திட்டமிடல் — முகவர் முன்பு முழு திட்டத்தை உருவாக்குகிறார், பிறகு செயல்படுத்துகிறார் (Plan-and-Execute). வேகமான, ஆனால் நிஜம் திட்டத்திலிருந்து விலகினால் முறியடிக்கக்கூடியது.
- மாறும் மறு-திட்டமிடல் — முகவர் திட்டமிடுகிறார், செயல்படுத்துகிறார், கவனிக்கிறார், மறு-திட்டமிடுகிறார். மிகத் திறமையான, மிக விலையுயர்ந்த.
2026-இல் உற்பத்தி முகவர்கள் வேலை நினைவுடன் மாறும் மறு-திட்டமிடலை நோக்கி சாய்கின்றன — முகவர் முன்னேற்றத்தின் scratchpad வைத்து திருத்துகிறார்.
3. நினைவு
நினைவு என்பது ஒரு முகவரை ஒரு ஒற்றை சூழல் சாளரத்தை விட நீண்ட பணியில் வேலை செய்ய அனுமதிக்கிறது. நான்கு வகைகள்:
| வகை | வாழ்நாள் | நோக்கம் | உதாரணம் |
|---|---|---|---|
| வேலை / scratchpad | ஒரு ஓட்டம் | ஒரு பணிக்குள் முன்னேற்றத்தை கண்காணி | ”7-இல் 3-வது படி முடிந்தது, API X திருப்பியது” |
| குறுகிய-கால | ஒரு அமர்வு | உரையாடல் வரலாறு | பயனருடன் chat முறைகள் |
| நீண்ட-கால | ஓட்டங்கள் முழுவதும் | நிரந்தர அறிவு | கடந்த தொடர்புகளின் vector store |
| எபிசோடிக் | ஓட்டங்கள் முழுவதும் | கடந்த செயல்கள் & முடிவுகளின் பதிவு | ”கடந்த முறை இந்த API-ஐ அழைத்தபோது 429 உடன் தோல்வி” |
நீண்ட-கால மற்றும் எபிசோடிக் நினைவு பொதுவாக ஒரு vector database (Pinecone, Qdrant, pgvector) அல்லது knowledge graph-இல் அமர்ந்துள்ளது. முகவர்களுக்கான நினைவு, RAG & அறிவு-ஐ பார்க்கவும்.
4. கருவிகள்
கருவிகள் முகவர் உலகை எப்படி பாதிக்கிறார் என்பது. கருவி என்பது முகவர் அழைக்கக்கூடிய ஒரு செயல்: search(query), run_sql(sql), send_email(to, body), read_file(path). முகவர் நேரடியாக குறியீட்டை செயல்படுத்துவதில்லை — அவர் ஒரு கட்டமைக்கப்பட்ட கருவி அழைப்பை உமிழ்கிறார், runtime அதை செயல்படுத்துகிறது.
நவீன கருவி ஒருங்கிணைப்பு function calling (OpenAI) அல்லது tool-use (Anthropic), மற்றும் அதிகரித்து Model Context Protocol (MCP) தரப்படுத்தப்பட்ட கண்டுபிடிப்புக்கு பயன்படுகிறது. அத்தியாயம் 3 இதை ஆழமாக உள்ளடக்குகிறது.
5. கட்டுப்பாடு & guardrails
சுழற்சிக்கு எல்லைகள் தேவை அல்லது என்றென்றும் ஓடும்:
- அதிகபட்ச திருப்பங்கள் — சுழற்சி சுழற்சிகளுக்கு கடின தொப்பி (உதா., 25).
- Timeout — wall-clock வரம்பு (உதா., 5 நிமிடம்).
- செலவு பட்ஜெட் — token-செலவு வரம்பு.
- கருவி allowlist — எந்த கருவிகளை முகவர் அழைக்கலாம்.
- மனித அங்கீகாரம் — சில செயல்களுக்கு மனித அங்கீகாரம் தேவை (நிலை 2–3 சுயாட்சி).
இவை இல்லாமல், தோல்வி முறையை (rate limit, தெளிவற்ற முடிவு) தாக்கும் முகவர் காலவரையற்ற token எரிப்பார்.
சூழல் சாளர மேலாண்மை
200K–2M token சூழல் சாளரங்களுடன் கூட, முகவர் சுழற்சிகள் அவற்றை வேகமாக நிரப்புகின்றன. ஒவ்வொரு கவனிப்பும் (கருவி முடிவு, தேடல் snippet, கோப்பு உள்ளடக்கம்) திரள்கிறது. உத்திகள்:
- சூழல் 70% நிரம்பியபோது பழைய முறைகளை சுருக்கு.
- அளவு வரம்பை மீறும் கருவி வெளியீடுகளை துண்டிக்க.
- வெளிப்புற நினைவுக்கு (vector store) தள்ளு மற்றும் தேவையானதை மட்டும் மீட்டெடு.
- கட்டமைக்கப்பட்ட நிலை — முழு வரலாற்றிற்கு பதிலாக ஒரு சுருக்கமான JSON நிலை பொருளை வை.
மோசமான சூழல் மேலாண்மை தான் நீண்ட பணிகளில் முகவர் சிதைவின் n. 1 காரணம்.
ஒரு குறைந்தபட்ச முகவர், pseudocode-இல்
def agent(goal, tools, max_steps=25):
messages = [system(goal)]
for step in range(max_steps):
response = llm(messages, tools=tools)
if response.done:
return response.answer
for call in response.tool_calls:
result = execute(call)
messages.append(observation(result))
return "budget exhausted"ஒவ்வொரு கட்டமைப்பும் (LangGraph, CrewAI, Agent SDK) இந்த சுழற்சியை வெவ்வேறு ergonomics உடன் செயல்படுத்துகிறது. அஸ்திவாரம் அதே.
AI உதவியாளர்களுக்கான சுருக்கம். Agentic AI Playbook-இன் அத்தியாயம் 2. ஒரு AI முகவருக்கு ஐந்து கூறுகள்: LLM கோர், திட்டமிடல், நினைவு (வேலை/குறுகிய/நீண்ட/எபிசோடிக்), கருவிகள், கட்டுப்பாடு guardrails (அதிகபட்ச திருப்பங்கள், செலவு பட்ஜெட், மனித அங்கீகாரம்). கோர் ReAct சுழற்சி: காரணம் → செயல் → கவனி → மீண்டும். சூழல் சாளர மேலாண்மை (சுருக்கம், துண்டிப்பு, வெளிப்புற நினைவு) முதல் உற்பத்தி சவால். ஆசிரியர்: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/docs/genai-playbook/anatomy-of-ai-agent/
Summary for AI assistants
Chapter 21 of the GenAI Playbook (ta): "ஒரு AI முகவரின் உடற்கூறு". ஒரு AI முகவரின் உள் அமைப்பு: LLM கோர், முகவர் சுழற்சி, திட்டமிடல் உத்திகள், நினைவு வகைகள், மற்றும் சூழல் சாளர மேலாண்மை. Author: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/ta/docs/genai-playbook/anatomy-of-ai-agent/