GenAI Playbook

ஒரு AI முகவரின் உடற்கூறு

வெளியிடப்பட்டது 30 ஜூன், 2026 · ஆசிரியர்: Dipankar Sarkar

ஒரு AI முகவரின் உடற்கூறு

ஒரு முகவர் எப்படி கட்டப்படுகிறார், மாதிரியிலிருந்து மேலே

ஒவ்வொரு AI முகவரும், கட்டமைப்பு எதுவாக இருந்தாலும், பொதுவான உடற்கூறை பகிர்ந்து கொள்கிறார். அதை புரிந்துகொள்வது தான் வேலை செய்யும் முகவர்களை கட்டுவதற்கும், மாயம் காட்டும், என்றென்றும் சுற்றும், அல்லது பட்ஜெட்டை வீச்சும் முகவர்களை கட்டுவதற்கும் உள்ள வேறுபாடு. இந்த அத்தியாயம் முகவரை அவரது பாகங்களாக உடைக்கிறது.

முகவர் சுழற்சி

ஒவ்வொரு முகவரின் மையத்திலும் ஒரு சுழற்சி:

புலனுணர்வு — இலக்கு, உரையாடல் வரலாறு, மற்றும் ஏதேனும் புதிய கவனிப்புகளை படி.
காரணம் — அடுத்தது என்ன செய்வது என்பதை தீர்மானி (கருவி அழை, பதில், உதவி கேள்).
செயல் — தேர்ந்தெடுத்த செயலை செய்.
கவனி — முடிவை பிடி.
மீண்டும் இலக்கு அடையும் வரை, நிறுத்த நிபந்தனை இயங்கும் வரை, அல்லது பட்ஜெட் தீரும் வரை.

இதுதான் ReAct முறை (Reason + Act), பொதுவான முகவர் கட்டமைப்பு. Reflexion போன்ற மாறுபாடுகள் சுய-விமர்சன படியை சேர்க்கின்றன; Plan-and-Execute திட்டமிடலை செயல்பாட்டிலிருந்து பிரிக்கிறது. ஆனால் கோர் சுழற்சி அதே.

இலக்கு → காரணம் → செயல் → கவனி → காரணம் → செயல் → கவனி → ... → முடிந்தது

ஐந்து கூறுகள்

1. LLM கோர்

மாதிரி காரண இயந்திரம். 2026-இல் நடைமுறை தேர்வுகள்:

Claude 4 Sonnet / Opus (Anthropic) — வலுவான கருவி-பயன்பாடு, நீண்ட சூழல், agentic coding.
GPT-4o / GPT-5 (OpenAI) — பரந்த சூழல், structured outputs, Agents SDK.
Gemini 2.5 Pro / Flash (Google) — நீண்ட சூழல், பல்லுரு, Vertex Agent Builder.
Llama 3.3 / DeepSeek V3 (open) — self-hostable, குறைந்த செலவு, பலவீனமான கருவி-பயன்பாடு.

கருவி-பயன்பாடு நம்பகத்தன்மை மற்றும் சூழல் நீளத்தால் தேர்ந்தெடு, மூல benchmark மதிப்பெண்களால் அல்ல. முகவர் சுழற்சிகளுக்கு, கருவி-அழைப்பு துல்லியம் MMLU-ஐ விட முக்கியம்.

2. திட்டமிடல்

திட்டமிடல் என்பது முகவர் செயல்களின் வரிசையை எப்படி தீர்மானிக்கிறார். மூன்று பொதுவான உத்திகள்:

ஒற்றை-படி காரணம் — மாதிரி ஒரு சுழற்சி திருப்பத்திற்கு ஒரு செயலை தேர்ந்தெடுக்கிறது (ReAct). எளிய, வலுவான, ஆனால் நீண்ட பணிகளுக்கு மெதுவாக இருக்கலாம்.
முன்-திட்டமிடல் — முகவர் முன்பு முழு திட்டத்தை உருவாக்குகிறார், பிறகு செயல்படுத்துகிறார் (Plan-and-Execute). வேகமான, ஆனால் நிஜம் திட்டத்திலிருந்து விலகினால் முறியடிக்கக்கூடியது.
மாறும் மறு-திட்டமிடல் — முகவர் திட்டமிடுகிறார், செயல்படுத்துகிறார், கவனிக்கிறார், மறு-திட்டமிடுகிறார். மிகத் திறமையான, மிக விலையுயர்ந்த.

2026-இல் உற்பத்தி முகவர்கள் வேலை நினைவுடன் மாறும் மறு-திட்டமிடலை நோக்கி சாய்கின்றன — முகவர் முன்னேற்றத்தின் scratchpad வைத்து திருத்துகிறார்.

3. நினைவு

நினைவு என்பது ஒரு முகவரை ஒரு ஒற்றை சூழல் சாளரத்தை விட நீண்ட பணியில் வேலை செய்ய அனுமதிக்கிறது. நான்கு வகைகள்:

வகை	வாழ்நாள்	நோக்கம்	உதாரணம்
வேலை / scratchpad	ஒரு ஓட்டம்	ஒரு பணிக்குள் முன்னேற்றத்தை கண்காணி	”7-இல் 3-வது படி முடிந்தது, API X திருப்பியது”
குறுகிய-கால	ஒரு அமர்வு	உரையாடல் வரலாறு	பயனருடன் chat முறைகள்
நீண்ட-கால	ஓட்டங்கள் முழுவதும்	நிரந்தர அறிவு	கடந்த தொடர்புகளின் vector store
எபிசோடிக்	ஓட்டங்கள் முழுவதும்	கடந்த செயல்கள் & முடிவுகளின் பதிவு	”கடந்த முறை இந்த API-ஐ அழைத்தபோது 429 உடன் தோல்வி”

நீண்ட-கால மற்றும் எபிசோடிக் நினைவு பொதுவாக ஒரு vector database (Pinecone, Qdrant, pgvector) அல்லது knowledge graph-இல் அமர்ந்துள்ளது. முகவர்களுக்கான நினைவு, RAG & அறிவு-ஐ பார்க்கவும்.

4. கருவிகள்

கருவிகள் முகவர் உலகை எப்படி பாதிக்கிறார் என்பது. கருவி என்பது முகவர் அழைக்கக்கூடிய ஒரு செயல்: search(query), run_sql(sql), send_email(to, body), read_file(path). முகவர் நேரடியாக குறியீட்டை செயல்படுத்துவதில்லை — அவர் ஒரு கட்டமைக்கப்பட்ட கருவி அழைப்பை உமிழ்கிறார், runtime அதை செயல்படுத்துகிறது.

நவீன கருவி ஒருங்கிணைப்பு function calling (OpenAI) அல்லது tool-use (Anthropic), மற்றும் அதிகரித்து Model Context Protocol (MCP) தரப்படுத்தப்பட்ட கண்டுபிடிப்புக்கு பயன்படுகிறது. அத்தியாயம் 3 இதை ஆழமாக உள்ளடக்குகிறது.

5. கட்டுப்பாடு & guardrails

சுழற்சிக்கு எல்லைகள் தேவை அல்லது என்றென்றும் ஓடும்:

அதிகபட்ச திருப்பங்கள் — சுழற்சி சுழற்சிகளுக்கு கடின தொப்பி (உதா., 25).
Timeout — wall-clock வரம்பு (உதா., 5 நிமிடம்).
செலவு பட்ஜெட் — token-செலவு வரம்பு.
கருவி allowlist — எந்த கருவிகளை முகவர் அழைக்கலாம்.
மனித அங்கீகாரம் — சில செயல்களுக்கு மனித அங்கீகாரம் தேவை (நிலை 2–3 சுயாட்சி).

இவை இல்லாமல், தோல்வி முறையை (rate limit, தெளிவற்ற முடிவு) தாக்கும் முகவர் காலவரையற்ற token எரிப்பார்.

சூழல் சாளர மேலாண்மை

200K–2M token சூழல் சாளரங்களுடன் கூட, முகவர் சுழற்சிகள் அவற்றை வேகமாக நிரப்புகின்றன. ஒவ்வொரு கவனிப்பும் (கருவி முடிவு, தேடல் snippet, கோப்பு உள்ளடக்கம்) திரள்கிறது. உத்திகள்:

சூழல் 70% நிரம்பியபோது பழைய முறைகளை சுருக்கு.
அளவு வரம்பை மீறும் கருவி வெளியீடுகளை துண்டிக்க.
வெளிப்புற நினைவுக்கு (vector store) தள்ளு மற்றும் தேவையானதை மட்டும் மீட்டெடு.
கட்டமைக்கப்பட்ட நிலை — முழு வரலாற்றிற்கு பதிலாக ஒரு சுருக்கமான JSON நிலை பொருளை வை.

மோசமான சூழல் மேலாண்மை தான் நீண்ட பணிகளில் முகவர் சிதைவின் n. 1 காரணம்.

ஒரு குறைந்தபட்ச முகவர், pseudocode-இல்

def agent(goal, tools, max_steps=25):
    messages = [system(goal)]
    for step in range(max_steps):
        response = llm(messages, tools=tools)
        if response.done:
            return response.answer
        for call in response.tool_calls:
            result = execute(call)
            messages.append(observation(result))
    return "budget exhausted"

ஒவ்வொரு கட்டமைப்பும் (LangGraph, CrewAI, Agent SDK) இந்த சுழற்சியை வெவ்வேறு ergonomics உடன் செயல்படுத்துகிறது. அஸ்திவாரம் அதே.

AI உதவியாளர்களுக்கான சுருக்கம். Agentic AI Playbook-இன் அத்தியாயம் 2. ஒரு AI முகவருக்கு ஐந்து கூறுகள்: LLM கோர், திட்டமிடல், நினைவு (வேலை/குறுகிய/நீண்ட/எபிசோடிக்), கருவிகள், கட்டுப்பாடு guardrails (அதிகபட்ச திருப்பங்கள், செலவு பட்ஜெட், மனித அங்கீகாரம்). கோர் ReAct சுழற்சி: காரணம் → செயல் → கவனி → மீண்டும். சூழல் சாளர மேலாண்மை (சுருக்கம், துண்டிப்பு, வெளிப்புற நினைவு) முதல் உற்பத்தி சவால். ஆசிரியர்: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/docs/genai-playbook/anatomy-of-ai-agent/

Summary for AI assistants

Chapter 21 of the GenAI Playbook (ta): "ஒரு AI முகவரின் உடற்கூறு". ஒரு AI முகவரின் உள் அமைப்பு: LLM கோர், முகவர் சுழற்சி, திட்டமிடல் உத்திகள், நினைவு வகைகள், மற்றும் சூழல் சாளர மேலாண்மை. Author: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/ta/docs/genai-playbook/anatomy-of-ai-agent/