Glossar

RAG – Retrieval-Augmented Generation

RAG steht für Retrieval-Augmented Generation. Es ist das wichtigste Architektur-Muster für KI-Antworten in Unternehmens-Kontexten 2026: Statt aus dem Modell-Gedächtnis zu antworten, ruft das System relevante Dokumente aus einer kuratierten Wissensbasis ab und stützt die Antwort auf diese Dokumente, mit Quellverweis.

Aufbau

Drei Bausteine: Indexer (zerlegt Dokumente in Abschnitte und legt Vektor-Repräsentationen ab), Retriever (sucht zu einer Anfrage die relevantesten Abschnitte) und Generator (formuliert Antwort auf Basis der Abschnitte mit Quellverweis). Vektor-Datenbanken sind dabei zentrales Werkzeug.

Warum es Standard wurde

RAG vermeidet Halluzination, weil das Modell aus konkreten Dokumenten antwortet statt aus statistischer Erinnerung. Wissens-Updates erfolgen durch neu indexierte Dokumente, nicht durch Re-Training. DSGVO-Löschung ist über Abschnitts-Löschung möglich. Audit-Pfade sind nativ enthalten.

Grenzen

Retrieval-Qualität ist Engpass. Wenn der Retriever falsche Abschnitte liefert, formuliert das Modell trotzdem überzeugend. Bewertungs-Harness muss Retrieval-Qualität separat messen. Bei sehr langen Dokumenten und komplexen Anfragen helfen Mehrstufen-Retrieval und Re-Ranking. Bei Tabellen und Diagrammen ist multimodales RAG nötig.

Beratungsgespräch buchen Vollständige englische Fassung lesen

Diese deutsche Fassung wird laufend ausgebaut. Für ein konkretes Projekt nutzen Sie bitte das Beratungsgespräch oder schreiben an info@ainora.lt.

RAG – Retrieval-Augmented Generation

Aufbau

Warum es Standard wurde

Grenzen

Discovery-Gespräch buchen