RAG (génération augmentée par récupération)
Architecture qui combine un moteur de recherche dans un corpus contrôlé et un modèle de langage générant la réponse à partir des extraits récupérés, avec citation source.
RAG (Retrieval-Augmented Generation) répond aux trois problèmes classiques des modèles génératifs : actualité des connaissances, traçabilité de la source, et limitation à un domaine contrôlé. La qualité d'une architecture RAG dépend autant de la qualité du retrieval (segmentation, indexation, reranking) que du modèle de génération. Une réponse RAG sans citation source visible est incomplète : elle ne permet pas la vérification.
Pour les usages en entreprise régulée, la chaîne RAG doit être auditable de bout en bout : index versionné, journal de requêtes, journal de récupération, journal de génération. Les contraintes RGPD et de propriété intellectuelle imposent un corpus contrôlé, pas un corpus aspiré du web. La maintenance d'une chaîne RAG en production est un travail d'ingénierie, pas un projet ponctuel.