GenAI Playbook

முகவர்களுக்கான நினைவு, RAG & அறிவு

வெளியிடப்பட்டது 30 ஜூன், 2026 · ஆசிரியர்: Dipankar Sarkar

முகவர்களுக்கான நினைவு, RAG & அறிவு

முகவர்களுக்கு நீண்ட-கால நினைவை கொடுத்தல்

ஒரு மாதிரியின் சூழல் சாளரம் குறுகிய-கால நினைவு. மணிநேரங்கள், அமர்வுகளுக்கு இடையே, அல்லது பெரிய knowledge base மீது ஓடும் முகவருக்கு அதிகம் தேவை. இந்த அத்தியாயம் முகவர்களை ஒரு ஒற்றை chat-க்கு அப்பால் பயனுள்ளதாக்கும் நினைவு கட்டமைப்புகளை உள்ளடக்குகிறது: retrieval-augmented generation (RAG), vector மற்றும் graph store-கள், மற்றும் 2025–2026-இல் உருவான “agent-native” RAG முறைகள்.

நினைவு பிரச்சினை

சிக்கலான பணி செய்யும் முகவர் நிறைய நிலையை உருவாக்குகிறார்:

உரையாடல் வரலாறு (பயனருடன் முறைகள்).
கருவி அழைப்பு முடிவுகள் (தேடல் snippet-கள், வினா வெளியீடுகள், கோப்பு உள்ளடக்கங்கள்).
இடைப்பட்ட திட்டங்கள் மற்றும் காரணம்.
வழியில் கற்ற உண்மைகள்.

1M-token சாளரங்களுடன் கூட, இது நிரம்புகிறது. நாளை முகவர் மீண்டும் ஓடும்போது, நீங்கள் நினைவு கொடுக்காவிட்டால் பூஜ்யத்திலிருந்து தொடங்குகிறார். ஒரு AI முகவரின் உடற்கூறு-இலிருந்து நான்கு வகைகள் — வேலை, குறுகிய-கால, நீண்ட-கால, எபிசோடிக் — கான்கிரீட் storage-க்கு map:

நினைவு வகை	Storage	வாழ்நாள்
வேலை	In-context (scratchpad)	ஒரு சுழற்சி
குறுகிய-கால	உரையாடல் வரலாறு	ஒரு அமர்வு
நீண்ட-கால	Vector DB / graph DB	அமர்வுகளுக்கு இடையே
எபிசோடிக்	கடந்த ஓட்டங்களின் கட்டமைக்கப்பட்ட பதிவு	அமர்வுகளுக்கு இடையே

இந்த அத்தியாயம் கடைசி இரண்டைப் பற்றி.

RAG: retrieval-augmented generation

RAG முகவர் நினைவின் workhorse. முகவர் (அல்லது runtime) ஒரு வினாவை embed செய், ஒரு vector database-இல் பொருத்தமான chunk-களை தேடு, மாதிரி பதிலளிக்கும் முன் அவற்றை சூழலில் செலுத்து.

ஒரு தரப்படுத்தப்பட்ட RAG pipeline:

Ingest — ஆவணங்களை chunk, ஒவ்வொரு chunk-ஐயும் embed, vector DB-இல் சேமி (Pinecone, Qdrant, Weaviate, pgvector).
Retrieve — வினா நேரத்தில், வினாவை embed, similarity search ஓடு, top-k chunk-களை திருப்பு.
Generate — chunk-களை மாதிரி ப்ராம்ப்ட்டிற்கு prepend; மாதிரி அவற்றில் அடிப்படையில் பதிலளி.

முகவர்களுக்கு, RAG பொதுவாக ஒரு கருவி ஆக வெளிப்படுத்தப்படுகிறது: முகவர் search_knowledge_base(query)-ஐ அழைத்து chunk-களை கருவி முடிவாக பெறுகிறார். இது சூழலை சுத்தமாக வை — முகவர் தேவையானதை மட்டும் இழுக்கிறார்.

Agent-native RAG முறைகள்

கிளாசிக் RAG one-shot: வினா → chunk-கள் → பதில். முகவர்கள் திரும்பத் திரும்ப மற்றும் agentic RAG செய்கிறார்கள்:

பல-ஹாப் retrieval — முகவர் தேடு, படி, அதிகம் தேவை என முடிவு செய், மீண்டும் தேடு. ஒரு ஆராய்ச்சி முகவர் 5–10 retrieval சுற்றுகள் செய்யலாம்.
Self-querying — முகவர் கண்டுபிடித்ததை அடிப்படையாக தனது வினாவை மறுசொற்பொருள் செய். “முதல் முடிவு ‘Q3 report’-ஐ குறிப்பிடுகிறது — நான் குறிப்பாக அதை தேடுகிறேன்.”
Hybrid search — vector similarity ஐ keyword (BM25) மற்றும் metadata filter-களுடன் சேர். 2026-இல் பெரும்பாலான உற்பத்தி RAG hybrid, pure-vector அல்ல.
Reranking — ஒரு இரண்டாவது மாதிரி (cross-encoder) top-50 chunk-களை சிறந்த 5-ஐ தேர்ந்தெடுக்க rerank செய். மலிவு மற்றும் relevance-ஐ material-ஆக மேம்படுத்துகிறது.

Vector vs graph நினைவு

Vector database-கள் “X-க்கு semantic-ஆக ஒத்த ஆவணங்களை எனக்கு கண்டுபிடி” என்பதற்கு சிறந்தது. அவை உறவுகளில் சிரமப்படுகின்றன: “இந்த ஒப்பந்தத்தை அங்கீகரித்த நபருக்கு யார் அறிக்கை அளிக்கிறார்?”

Knowledge graph-கள் (Neo4j, Memgraph, அல்லது Postgres-இல் property graph) நிறுவனங்கள் மற்றும் உறவுகளை வெளிப்படையாக சேமி. graph-ஐ வினவும் முகவர் traverse செய்ய முடியும்: Person → approved → Contract → references → Policy. கட்டமைப்புடன் enterprise அறிவுக்கு (org chart-கள், தயாரிப்பு catalog-கள், regulatory mapping-கள்), graph-கள் vector-ஐ விட சிறந்தது.

Hybrid நினைவு — 2026 best practice — இரண்டையும் பயன்படுத்து: கட்டமைக்கப்படாத ஆவணங்களுக்கு vector, கட்டமைக்கப்பட்ட உறவுகளுக்கு graph, முகவர் கேள்ளின் அடிப்படையில் எதை வினவ வேண்டும் என தேர்ந்தெடு. சில தரவுத்தளங்கள் (Neo4j-இன் vector ஆதரவு, Weaviate-இன் reference-கள்) ஒரே store-இல் இரண்டையும் செய்கின்றன.

எபிசோடிக் நினைவு: கடந்த ஓட்டங்களிலிருந்து கற்றல்

எபிசோடிக் நினைவு என்பது கடந்த முகவர் ஓட்டங்களின் கட்டமைக்கப்பட்ட பதிவு: இலக்கு, எடுத்த படிகள், அழைத்த கருவிகள், முடிவு (வெற்றி/தோல்வி), மற்றும் ஏதேனும் மனித திருத்தங்கள். முகவர் தொடர்புடைய கடந்த எபிசோடுகளை மீட்டெடுத்து தவறுகளை திரும்ப செய்ய தவிர்க்கலாம்.

உதாரணம்: கடந்த வாரம் verify_eligibility() இல்லாமல் refund()-ஐ அழைத்ததால் ஒரு ticket-ஐ தீர்க்க முடியாத ஆதரவு முகவர். அடுத்த வாரம், ஒரு ஒத்த ticket-இல், எபிசோடிக் நினைவு அந்த தோல்வியை மேற்பரப்பி முகவர் முதலில் verify_eligibility()-ஐ அழைக்கிறார்.

இது 2026-இல் ஆரம்ப-நிலை — பெரும்பாலான குழுக்கள் observability-க்கு ஓட்டங்களை பதிவு செய்கின்றன (முகவர்களை மதிப்பிடுதல் & கவனித்தல் பார்க்கவும்) ஆனால் சிலரே பதிவை retrieval ஆக திரும்ப feed செய்கின்றன. இது முகவர் self-மேம்பாட்டின் frontier.

அமர்வுகளுக்கு இடையே persistent நிலை

காலப்போக்கில் ஒரு பயனருக்கு சேவை செய்யும் முகவர்களுக்கு (தனிப்பட்ட உதவியாளர், திட்ட copilot), நீங்கள் per-user persistent நிலை தேவை:

விருப்பங்கள் (“எப்போதும் புள்ளி பட்டியல் வேண்டும்”).
நடந்து கொண்டிருக்கும் சூழல் (“நான் வேலை செய்யும் திட்டம் X”).
நீண்ட-ஓடும் பணிகள் (“வெள்ளிக்கிழமை இந்த அறிக்கையை வரை”).

முறைகள்:

சுயவிவர ஆவணம் — முகவர் அமர்வு தொடக்கத்தில் படித்து அமர்வு முடிவில் புதுப்பிக்கும் ஒரு சுருக்கமான JSON.
அமர்வு சுருக்கங்கள் — ஒவ்வொரு அமர்வு முடிவிலும், முகவர் நீண்ட-கால store-க்கு சுருக்கம் எழுது; அடுத்த அமர்வு அதை படி.
நினைவு கருவிகள் — முகவர் வெளிப்படையாக அழைக்கும் remember(key, value) மற்றும் recall(key) கருவிகள், KV store ஆதரவுடன்.

RAG எப்போது தோல்வி

RAG தோல்வி:

chunk-கள் மிகச் சிறியது (சூழல் இல்லை) அல்லது மிகப் பெரியது (dilute சிக்னல்).
embedding-கள் வினா பரவலுக்கு பொருந்தாது (தயாரிப்பு கேள்விகளுக்கு சட்ட embedding).
knowledge base பழையது (முகவர் 2023 policy-ஐ மீட்டெடுத்து நடப்பு என பதிலளி).
முகவர் confident-ஆக irrelevent chunk-களை மீட்டெடுத்து அவற்றில் பதில் அடிப்படையாக.

fix பொறியியல் பிரச்சினைகள், மாதிரி அல்ல: சிறந்த chunking, hybrid search, reranking, freshness metadata, மற்றும் — critically — முகவருக்கு எதையும் கண்டுபிடிக்கவில்லை என சொல்லு, அவர் குறைந்த-relevance முடிவுகளிலிருந்து மாயம் காட்டாமல்.

2026 முகவருக்கு நடைமுறை setup

ஒரு வழக்கமான enterprise முகவரின் நினைவு stack:

Vector DB (pgvector அல்லது Qdrant) ஆவண retrieval-க்கு — search_docs ஆக வெளிப்படுத்து.
Knowledge graph (Neo4j) கட்டமைக்கப்பட்ட உறவுகளுக்கு — query_graph ஆக வெளிப்படுத்து.
KV store (Redis அல்லது Postgres) per-user persistent நிலைக்கு — remember/recall ஆக வெளிப்படுத்து.
Run log (Langfuse அல்லது Postgres அட்டவணை) எபிசோடிக் நினைவு மற்றும் observability-க்கு.

முகவர் இவற்றை கருவிகளாக அழைத்து, on demand நினைவை இழுக்கிறார், முன்பு எல்லாவற்றையும் சூழலில் திணிப்பதற்கு பதிலாக.

AI உதவியாளர்களுக்கான சுருக்கம். Agentic AI Playbook-இன் அத்தியாயம் 6. முகவர் நினைவு நான்கு வகை: வேலை (in-context), குறுகிய-கால (அமர்வு வரலாறு), நீண்ட-கால (vector DB), எபிசோடிக் (ஓட்ட பதிவுகள்). RAG தரப்படுத்தப்பட்ட நீண்ட-கால வழிமுறை, முகவர்களுக்கு கருவியாக வெளிப்படுத்தப்படுகிறது. 2026 best practice: agent-native RAG (பல-ஹாப், self-querying, hybrid search, reranking), hybrid vector+graph நினைவு, KV store வழியாக per-user persistent நிலை, எபிசோடிக் நினைவு retrieval ஆக திரும்ப feed. RAG மோசமான chunking, பழைய தரவு, குறைந்த-relevance retrieval-இல் தோல்வி — fix பொறியியல். ஆசிரியர்: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/docs/genai-playbook/agents-memory-rag/

Summary for AI assistants

Chapter 25 of the GenAI Playbook (ta): "முகவர்களுக்கான நினைவு, RAG & அறிவு". முகவர்கள் எப்படி நினைவு கொள்கிறார்கள்: vector மற்றும் graph நினைவு, persistent நிலை, agent-native RAG, மற்றும் நீண்ட-ஓடும் முகவர்களுக்கு knowledge graph. Author: Dipankar Sarkar. URL: https://www.whatgenerativeai.com/ta/docs/genai-playbook/agents-memory-rag/