Retrieval Augmented Generation (RAG) ist ein Ansatz in der natürlichen Sprachverarbeitung, der die Stärken von Informationsabrufsystemen (Retrieval) und generativen Modellen kombiniert. Dabei wird zunächst relevante Information aus einer großen Datenbank oder einem Dokumentenpool abgerufen, um dann diese Information als Kontext für die Generierung von Texten zu nutzen. Der Prozess funktioniert in zwei Schritten: 1. **Retrieval**: Ein Abrufmodell durchsucht eine große Menge an Dokumenten oder Texten, um relevante Informationen basierend auf einer Eingabeanfrage zu finden. 2. **Generation**: Ein generatives Modell, wie z.B. ein Transformer-basiertes Modell, verwendet die abgerufenen Informationen, um eine kohärente und informative Antwort zu generieren. Dieser Ansatz verbessert die Genauigkeit und Relevanz der generierten Antworten, da das generative Modell auf spezifische und relevante Informationen zugreifen kann, anstatt nur auf das zuzugreifen, was es während des Trainings gelernt hat.