I
Impetora
Arquitectura

RAG

Retrieval-augmented generation: técnica que combina búsqueda en una base de conocimiento controlada con generación de texto, lo que reduce alucinaciones y permite citas verificables.

Qué es RAG?

Un sistema RAG ingiere documentos, los divide en fragmentos, calcula una representación vectorial (embeddings) y los almacena en una base de datos vectorial. En tiempo de consulta, recupera los fragmentos más relevantes y los pasa al modelo generador junto con la pregunta del usuario. El resultado es una respuesta acompañada de los fragmentos fuente. La calidad depende de la segmentación, del tipo de embeddings, del re-ranking, del umbral de relevancia y del prompt del generador.

Cómo se aplica RAG en la IA empresarial?

RAG es la arquitectura por defecto cuando la respuesta debe estar anclada a documentos verificables: políticas internas, manuales técnicos, normativa, contratos. Para uso empresarial, tres requisitos no son negociables. Primero, citas a página y párrafo, no a documento entero. Segundo, evaluación cuantificable con un conjunto dorado anotado por expertos del dominio. Tercero, control de acceso que asegure que el sistema solo recupera fragmentos que el usuario autenticado tiene derecho a ver.

Términos relacionados

Referencias externas

Impetora

Necesita aplicar RAG a su empresa? Envíenos un resumen corto y responderemos en un día laborable.

Reservar una llamada de descubrimientoVolver al glosario
Llamada de descubrimiento

Reserva una llamada de descubrimiento

Cuéntanos qué quieres construir. Respondemos en un día hábil.

Llamada de 30 minutos. Gratis. Sin compromiso.