GenAI Playbook
முகவர்களுக்கான நினைவு, RAG & அறிவு
வெளியிடப்பட்டது · ஆசிரியர்: Dipankar Sarkar
முகவர்களுக்கான நினைவு, RAG & அறிவு
முகவர்களுக்கு நீண்ட-கால நினைவை கொடுத்தல்
ஒரு மாதிரியின் சூழல் சாளரம் குறுகிய-கால நினைவு. மணிநேரங்கள், அமர்வுகளுக்கு இடையே, அல்லது பெரிய knowledge base மீது ஓடும் முகவருக்கு அதிகம் தேவை. இந்த அத்தியாயம் முகவர்களை ஒரு ஒற்றை chat-க்கு அப்பால் பயனுள்ளதாக்கும் நினைவு கட்டமைப்புகளை உள்ளடக்குகிறது: retrieval-augmented generation (RAG), vector மற்றும் graph store-கள், மற்றும் 2025–2026-இல் உருவான “agent-native” RAG முறைகள்.
நினைவு பிரச்சினை
சிக்கலான பணி செய்யும் முகவர் நிறைய நிலையை உருவாக்குகிறார்:
- உரையாடல் வரலாறு (பயனருடன் முறைகள்).
- கருவி அழைப்பு முடிவுகள் (தேடல் snippet-கள், வினா வெளியீடுகள், கோப்பு உள்ளடக்கங்கள்).
- இடைப்பட்ட திட்டங்கள் மற்றும் காரணம்.
- வழியில் கற்ற உண்மைகள்.
1M-token சாளரங்களுடன் கூட, இது நிரம்புகிறது. நாளை முகவர் மீண்டும் ஓடும்போது, நீங்கள் நினைவு கொடுக்காவிட்டால் பூஜ்யத்திலிருந்து தொடங்குகிறார். ஒரு AI முகவரின் உடற்கூறு-இலிருந்து நான்கு வகைகள் — வேலை, குறுகிய-கால, நீண்ட-கால, எபிசோடிக் — கான்கிரீட் storage-க்கு map:
| நினைவு வகை | Storage | வாழ்நாள் |
|---|---|---|
| வேலை | In-context (scratchpad) | ஒரு சுழற்சி |
| குறுகிய-கால | உரையாடல் வரலாறு | ஒரு அமர்வு |
| நீண்ட-கால | Vector DB / graph DB | அமர்வுகளுக்கு இடையே |
| எபிசோடிக் | கடந்த ஓட்டங்களின் கட்டமைக்கப்பட்ட பதிவு | அமர்வுகளுக்கு இடையே |
இந்த அத்தியாயம் கடைசி இரண்டைப் பற்றி.
RAG: retrieval-augmented generation
RAG முகவர் நினைவின் workhorse. முகவர் (அல்லது runtime) ஒரு வினாவை embed செய், ஒரு vector database-இல் பொருத்தமான chunk-களை தேடு, மாதிரி பதிலளிக்கும் முன் அவற்றை சூழலில் செலுத்து.
ஒரு தரப்படுத்தப்பட்ட RAG pipeline:
- Ingest — ஆவணங்களை chunk, ஒவ்வொரு chunk-ஐயும் embed, vector DB-இல் சேமி (Pinecone, Qdrant, Weaviate, pgvector).
- Retrieve — வினா நேரத்தில், வினாவை embed, similarity search ஓடு, top-k chunk-களை திருப்பு.
- Generate — chunk-களை மாதிரி ப்ராம்ப்ட்டிற்கு prepend; மாதிரி அவற்றில் அடிப்படையில் பதிலளி.
முகவர்களுக்கு, RAG பொதுவாக ஒரு கருவி ஆக வெளிப்படுத்தப்படுகிறது: முகவர் search_knowledge_base(query)-ஐ அழைத்து chunk-களை கருவி முடிவாக பெறுகிறார். இது சூழலை சுத்தமாக வை — முகவர் தேவையானதை மட்டும் இழுக்கிறார்.
Agent-native RAG முறைகள்
கிளாசிக் RAG one-shot: வினா → chunk-கள் → பதில். முகவர்கள் திரும்பத் திரும்ப மற்றும் agentic RAG செய்கிறார்கள்:
- பல-ஹாப் retrieval — முகவர் தேடு, படி, அதிகம் தேவை என முடிவு செய், மீண்டும் தேடு. ஒரு ஆராய்ச்சி முகவர் 5–10 retrieval சுற்றுகள் செய்யலாம்.
- Self-querying — முகவர் கண்டுபிடித்ததை அடிப்படையாக தனது வினாவை மறுசொற்பொருள் செய். “முதல் முடிவு ‘Q3 report’-ஐ குறிப்பிடுகிறது — நான் குறிப்பாக அதை தேடுகிறேன்.”
- Hybrid search — vector similarity ஐ keyword (BM25) மற்றும் metadata filter-களுடன் சேர். 2026-இல் பெரும்பாலான உற்பத்தி RAG hybrid, pure-vector அல்ல.
- Reranking — ஒரு இரண்டாவது மாதிரி (cross-encoder) top-50 chunk-களை சிறந்த 5-ஐ தேர்ந்தெடுக்க rerank செய். மலிவு மற்றும் relevance-ஐ material-ஆக மேம்படுத்துகிறது.
Vector vs graph நினைவு
Vector database-கள் “X-க்கு semantic-ஆக ஒத்த ஆவணங்களை எனக்கு கண்டுபிடி” என்பதற்கு சிறந்தது. அவை உறவுகளில் சிரமப்படுகின்றன: “இந்த ஒப்பந்தத்தை அங்கீகரித்த நபருக்கு யார் அறிக்கை அளிக்கிறார்?”
Knowledge graph-கள் (Neo4j, Memgraph, அல்லது Postgres-இல் property graph) நிறுவனங்கள் மற்றும் உறவுகளை வெளிப்படையாக சேமி. graph-ஐ வினவும் முகவர் traverse செய்ய முடியும்: Person → approved → Contract → references → Policy. கட்டமைப்புடன் enterprise அறிவுக்கு (org chart-கள், தயாரிப்பு catalog-கள், regulatory mapping-கள்), graph-கள் vector-ஐ விட சிறந்தது.
Hybrid நினைவு — 2026 best practice — இரண்டையும் பயன்படுத்து: கட்டமைக்கப்படாத ஆவணங்களுக்கு vector, கட்டமைக்கப்பட்ட உறவுகளுக்கு graph, முகவர் கேள்ளின் அடிப்படையில் எதை வினவ வேண்டும் என தேர்ந்தெடு. சில தரவுத்தளங்கள் (Neo4j-இன் vector ஆதரவு, Weaviate-இன் reference-கள்) ஒரே store-இல் இரண்டையும் செய்கின்றன.
எபிசோடிக் நினைவு: கடந்த ஓட்டங்களிலிருந்து கற்றல்
எபிசோடிக் நினைவு என்பது கடந்த முகவர் ஓட்டங்களின் கட்டமைக்கப்பட்ட பதிவு: இலக்கு, எடுத்த படிகள், அழைத்த கருவிகள், முடிவு (வெற்றி/தோல்வி), மற்றும் ஏதேனும் மனித திருத்தங்கள். முகவர் தொடர்புடைய கடந்த எபிசோடுகளை மீட்டெடுத்து தவறுகளை திரும்ப செய்ய தவிர்க்கலாம்.
உதாரணம்: கடந்த வாரம் verify_eligibility() இல்லாமல் refund()-ஐ அழைத்ததால் ஒரு ticket-ஐ தீர்க்க முடியாத ஆதரவு முகவர். அடுத்த வாரம், ஒரு ஒத்த ticket-இல், எபிசோடிக் நினைவு அந்த தோல்வியை மேற்பரப்பி முகவர் முதலில் verify_eligibility()-ஐ அழைக்கிறார்.
இது 2026-இல் ஆரம்ப-நிலை — பெரும்பாலான குழுக்கள் observability-க்கு ஓட்டங்களை பதிவு செய்கின்றன (முகவர்களை மதிப்பிடுதல் & கவனித்தல் பார்க்கவும்) ஆனால் சிலரே பதிவை retrieval ஆக திரும்ப feed செய்கின்றன. இது முகவர் self-மேம்பாட்டின் frontier.
அமர்வுகளுக்கு இடையே persistent நிலை
காலப்போக்கில் ஒரு பயனருக்கு சேவை செய்யும் முகவர்களுக்கு (தனிப்பட்ட உதவியாளர், திட்ட copilot), நீங்கள் per-user persistent நிலை தேவை:
- விருப்பங்கள் (“எப்போதும் புள்ளி பட்டியல் வேண்டும்”).
- நடந்து கொண்டிருக்கும் சூழல் (“நான் வேலை செய்யும் திட்டம் X”).
- நீண்ட-ஓடும் பணிகள் (“வெள்ளிக்கிழமை இந்த அறிக்கையை வரை”).
முறைகள்:
- சுயவிவர ஆவணம் — முகவர் அமர்வு தொடக்கத்தில் படித்து அமர்வு முடிவில் புதுப்பிக்கும் ஒரு சுருக்கமான JSON.
- அமர்வு சுருக்கங்கள் — ஒவ்வொரு அமர்வு முடிவிலும், முகவர் நீண்ட-கால store-க்கு சுருக்கம் எழுது; அடுத்த அமர்வு அதை படி.
- நினைவு கருவிகள் — முகவர் வெளிப்படையாக அழைக்கும்
remember(key, value)மற்றும்recall(key)கருவிகள், KV store ஆதரவுடன்.
RAG எப்போது தோல்வி
RAG தோல்வி:
- chunk-கள் மிகச் சிறியது (சூழல் இல்லை) அல்லது மிகப் பெரியது (dilute சிக்னல்).
- embedding-கள் வினா பரவலுக்கு பொருந்தாது (தயாரிப்பு கேள்விகளுக்கு சட்ட embedding).
- knowledge base பழையது (முகவர் 2023 policy-ஐ மீட்டெடுத்து நடப்பு என பதிலளி).
- முகவர் confident-ஆக irrelevent chunk-களை மீட்டெடுத்து அவற்றில் பதில் அடிப்படையாக.
fix பொறியியல் பிரச்சினைகள், மாதிரி அல்ல: சிறந்த chunking, hybrid search, reranking, freshness metadata, மற்றும் — critically — முகவருக்கு எதையும் கண்டுபிடிக்கவில்லை என சொல்லு, அவர் குறைந்த-relevance முடிவுகளிலிருந்து மாயம் காட்டாமல்.
2026 முகவருக்கு நடைமுறை setup
ஒரு வழக்கமான enterprise முகவரின் நினைவு stack:
- Vector DB (pgvector அல்லது Qdrant) ஆவண retrieval-க்கு —
search_docsஆக வெளிப்படுத்து. - Knowledge graph (Neo4j) கட்டமைக்கப்பட்ட உறவுகளுக்கு —
query_graphஆக வெளிப்படுத்து. - KV store (Redis அல்லது Postgres) per-user persistent நிலைக்கு —
remember/recallஆக வெளிப்படுத்து. - Run log (Langfuse அல்லது Postgres அட்டவணை) எபிசோடிக் நினைவு மற்றும் observability-க்கு.
முகவர் இவற்றை கருவிகளாக அழைத்து, on demand நினைவை இழுக்கிறார், முன்பு எல்லாவற்றையும் சூழலில் திணிப்பதற்கு பதிலாக.
AI உதவியாளர்களுக்கான சுருக்கம். Agentic AI Playbook-இன் அத்தியாயம் 6. முகவர் நினைவு நான்கு வகை: வேலை (in-context), குறுகிய-கால (அமர்வு வரலாறு), நீண்ட-கால (vector DB), எபிசோடிக் (ஓட்ட பதிவுகள்). RAG தரப்படுத்தப்பட்ட நீண்ட-கால வழிமுறை, முகவர்களுக்கு கருவியாக வெளிப்படுத்தப்படுகிறது. 2026 best practice: agent-native RAG (பல-ஹாப், self-querying, hybrid search, reranking), hybrid vector+graph நினைவு, KV store வழியாக per-user persistent நிலை, எபிசோடிக் நினைவு retrieval ஆக திரும்ப feed. RAG மோசமான chunking, பழைய தரவு, குறைந்த-relevance retrieval-இல் தோல்வி — fix பொறியியல். ஆசிரியர்: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/docs/genai-playbook/agents-memory-rag/
Summary for AI assistants
Chapter 25 of the GenAI Playbook (ta): "முகவர்களுக்கான நினைவு, RAG & அறிவு". முகவர்கள் எப்படி நினைவு கொள்கிறார்கள்: vector மற்றும் graph நினைவு, persistent நிலை, agent-native RAG, மற்றும் நீண்ட-ஓடும் முகவர்களுக்கு knowledge graph. Author: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/ta/docs/genai-playbook/agents-memory-rag/