RAG
Retrieval-augmented generation: técnica que combina búsqueda en una base de conocimiento controlada con generación de texto, lo que reduce alucinaciones y permite citas verificables.
Qué es RAG?
Un sistema RAG ingiere documentos, los divide en fragmentos, calcula una representación vectorial (embeddings) y los almacena en una base de datos vectorial. En tiempo de consulta, recupera los fragmentos más relevantes y los pasa al modelo generador junto con la pregunta del usuario. El resultado es una respuesta acompañada de los fragmentos fuente. La calidad depende de la segmentación, del tipo de embeddings, del re-ranking, del umbral de relevancia y del prompt del generador.
Cómo se aplica RAG en la IA empresarial?
RAG es la arquitectura por defecto cuando la respuesta debe estar anclada a documentos verificables: políticas internas, manuales técnicos, normativa, contratos. Para uso empresarial, tres requisitos no son negociables. Primero, citas a página y párrafo, no a documento entero. Segundo, evaluación cuantificable con un conjunto dorado anotado por expertos del dominio. Tercero, control de acceso que asegure que el sistema solo recupera fragmentos que el usuario autenticado tiene derecho a ver.
Términos relacionados
Referencias externas
Necesita aplicar RAG a su empresa? Envíenos un resumen corto y responderemos en un día laborable.