Retrieval Augmented Generation (RAG)
Was ist Retrieval Augmented Generation (RAG)?
Retrieval Augmented Generation, kurz RAG, ist ein Verfahren, das große Sprachmodelle mit einer Suchkomponente kombiniert. Anstatt ausschließlich aus Trainingsdaten zu antworten, ruft das Modell relevante Informationen aus einer externen Wissensbasis ab und generiert die Antwort auf dieser Grundlage. So entstehen präzisere, aktuelle und nachvollziehbare Ergebnisse.
Wie funktioniert Retrieval Augmented Generation?
Ein RAG-System besteht aus zwei Stufen. Zuerst durchsucht ein Retriever eine Vektordatenbank nach semantisch passenden Dokumenten. Anschließend übergibt er die gefundenen Textabschnitte zusammen mit der Nutzerfrage an ein Sprachmodell wie GPT-4 oder Claude. Das Modell formuliert die Antwort unter Berücksichtigung der abgerufenen Quellen und kann die Fundstellen sogar als Beleg ausgeben.
Vorteile für Unternehmen
RAG macht firmeneigenes Wissen aus SharePoint, Confluence oder Fachdatenbanken in Chatbots und Assistenten nutzbar. Halluzinationen reduzieren sich, weil Antworten auf echten Dokumenten basieren. Da die Wissensbasis extern liegt, aktualisieren Sie Inhalte ohne erneutes Training des Modells. Datenschutz und Governance bleiben kontrollierbar.
Einsatzszenarien in der Praxis
Typische Anwendungen sind interne Wissensassistenten, automatisierte Support-Chatbots, intelligente Suche in technischer Dokumentation und juristische Recherchehilfen. Frameworks wie LangChain oder LlamaIndex vereinfachen den Aufbau. Die KI-Experten der W+W Consulting entwickeln mit Ihnen RAG-Lösungen auf Basis von Azure OpenAI oder anderen Plattformen, abgestimmt auf Ihre Prozesse und Compliance-Anforderungen.
Abgrenzung zum Fine-Tuning
Fine-Tuning trainiert ein Modell mit neuen Daten und verändert dessen Gewichte. RAG dagegen lässt das Modell unverändert und erweitert nur den Kontext zur Laufzeit. Für faktenbasierte Fragen mit sich ändernden Inhalten ist RAG meist die günstigere und flexiblere Wahl. Mehr zu verwandten Grundlagen finden Sie in unserem Eintrag zu Machine Learning.
Möchten Sie Ihr Unternehmenswissen mit KI zugänglich machen? Unsere Berater konzipieren und implementieren die passende RAG-Architektur für Ihren Use Case.