I
Impetora
Glossar

RAG – Retrieval-Augmented Generation

RAG steht für Retrieval-Augmented Generation. Es ist das wichtigste Architektur-Muster für KI-Antworten in Unternehmens-Kontexten 2026: Statt aus dem Modell-Gedächtnis zu antworten, ruft das System relevante Dokumente aus einer kuratierten Wissensbasis ab und stützt die Antwort auf diese Dokumente, mit Quellverweis.

Aufbau

Drei Bausteine: Indexer (zerlegt Dokumente in Abschnitte und legt Vektor-Repräsentationen ab), Retriever (sucht zu einer Anfrage die relevantesten Abschnitte) und Generator (formuliert Antwort auf Basis der Abschnitte mit Quellverweis). Vektor-Datenbanken sind dabei zentrales Werkzeug.

Warum es Standard wurde

RAG vermeidet Halluzination, weil das Modell aus konkreten Dokumenten antwortet statt aus statistischer Erinnerung. Wissens-Updates erfolgen durch neu indexierte Dokumente, nicht durch Re-Training. DSGVO-Löschung ist über Abschnitts-Löschung möglich. Audit-Pfade sind nativ enthalten.

Grenzen

Retrieval-Qualität ist Engpass. Wenn der Retriever falsche Abschnitte liefert, formuliert das Modell trotzdem überzeugend. Bewertungs-Harness muss Retrieval-Qualität separat messen. Bei sehr langen Dokumenten und komplexen Anfragen helfen Mehrstufen-Retrieval und Re-Ranking. Bei Tabellen und Diagrammen ist multimodales RAG nötig.

Diese deutsche Fassung wird laufend ausgebaut. Für ein konkretes Projekt nutzen Sie bitte das Beratungsgespräch oder schreiben an info@ainora.lt.

Discovery-Gespräch

Discovery-Gespräch buchen

Erzählen Sie uns, was Sie bauen möchten. Wir antworten innerhalb eines Werktages.

30-minütiges Gespräch. Kostenfrei. Unverbindlich.