RAG – Retrieval-Augmented Generation
RAG steht für Retrieval-Augmented Generation. Es ist das wichtigste Architektur-Muster für KI-Antworten in Unternehmens-Kontexten 2026: Statt aus dem Modell-Gedächtnis zu antworten, ruft das System relevante Dokumente aus einer kuratierten Wissensbasis ab und stützt die Antwort auf diese Dokumente, mit Quellverweis.
Aufbau
Drei Bausteine: Indexer (zerlegt Dokumente in Abschnitte und legt Vektor-Repräsentationen ab), Retriever (sucht zu einer Anfrage die relevantesten Abschnitte) und Generator (formuliert Antwort auf Basis der Abschnitte mit Quellverweis). Vektor-Datenbanken sind dabei zentrales Werkzeug.
Warum es Standard wurde
RAG vermeidet Halluzination, weil das Modell aus konkreten Dokumenten antwortet statt aus statistischer Erinnerung. Wissens-Updates erfolgen durch neu indexierte Dokumente, nicht durch Re-Training. DSGVO-Löschung ist über Abschnitts-Löschung möglich. Audit-Pfade sind nativ enthalten.
Grenzen
Retrieval-Qualität ist Engpass. Wenn der Retriever falsche Abschnitte liefert, formuliert das Modell trotzdem überzeugend. Bewertungs-Harness muss Retrieval-Qualität separat messen. Bei sehr langen Dokumenten und komplexen Anfragen helfen Mehrstufen-Retrieval und Re-Ranking. Bei Tabellen und Diagrammen ist multimodales RAG nötig.
Diese deutsche Fassung wird laufend ausgebaut. Für ein konkretes Projekt nutzen Sie bitte das Beratungsgespräch oder schreiben an info@ainora.lt.