Arquitectura

RAG

Retrieval-augmented generation: técnica que combina búsqueda en una base de conocimiento controlada con generación de texto, lo que reduce alucinaciones y permite citas verificables.

Qué es RAG?

Un sistema RAG ingiere documentos, los divide en fragmentos, calcula una representación vectorial (embeddings) y los almacena en una base de datos vectorial. En tiempo de consulta, recupera los fragmentos más relevantes y los pasa al modelo generador junto con la pregunta del usuario. El resultado es una respuesta acompañada de los fragmentos fuente. La calidad depende de la segmentación, del tipo de embeddings, del re-ranking, del umbral de relevancia y del prompt del generador.

Cómo se aplica RAG en la IA empresarial?

RAG es la arquitectura por defecto cuando la respuesta debe estar anclada a documentos verificables: políticas internas, manuales técnicos, normativa, contratos. Para uso empresarial, tres requisitos no son negociables. Primero, citas a página y párrafo, no a documento entero. Segundo, evaluación cuantificable con un conjunto dorado anotado por expertos del dominio. Tercero, control de acceso que asegure que el sistema solo recupera fragmentos que el usuario autenticado tiene derecho a ver.

Términos relacionados

Ajuste fino

Fine-tuning para especializar modelos.

Harness de evaluación

Banco de pruebas reproducible.

Referencias externas

Sistemas de conocimiento interno - Impetora

Impetora

Necesita aplicar RAG a su empresa? Envíenos un resumen corto y responderemos en un día laborable.

Reservar una llamada de descubrimiento Volver al glosario

RAG

Qué es RAG?

Cómo se aplica RAG en la IA empresarial?

Términos relacionados

Referencias externas

Reserva una llamada de descubrimiento