Phase 1 · Step 4 von 9
Du lernst den Ablauf kennen: Frage, Suche, Kontextpaket und Antwort.
Was du mitnimmst
RAG macht LLM-Antworten quellenbezogener; die Qualität hängt an der gesamten Pipeline.

Du lernst RAG als einfachen Laufzeit-Ablauf kennen: Eine Frage kommt rein, passende Quellen werden gesucht, ein Kontextpaket wird gebaut und das LLM formuliert daraus eine Antwort. Danach erkennst du, an welchen Stationen Antwortqualität entsteht.
RAG beantwortet eine einfache Kernfrage: Wie bekommt ein LLM genau die Informationen, die es für diese Antwort braucht?
Der Ablauf ist kurz: suchen, Kontext beilegen, antworten lassen. In der Praxis entscheidet jede Station darüber, ob die Antwort hilfreich, aktuell und belegbar wird.
Dieser Schritt zeigt den Grundablauf, auf dem GraphRAG später aufsetzt. Wenn dieser Ablauf unklar bleibt, verschwimmen Suche, Kontextpaket und Antwortformulierung zu einem einzigen schwer prüfbaren Vorgang.
RAG steht für Retrieval-Augmented Generation. Retrieval sucht passende Quellen oder Textabschnitte. Augmentation legt die gefundenen Informationen als Kontext zur Frage. Generation formuliert daraus eine Antwort.
Diese Pipeline macht Wissen kontrollierbarer: Dokumente können aktualisiert, Quellen können angezeigt und Suchqualität kann gemessen werden. Das macht RAG für Unternehmenswissen so attraktiv.
RAG verbessert Antworten, wenn Quellen, Berechtigungen, Kontextauswahl und Modellinterpretation zusammenpassen. Die Antwortqualität hängt deshalb an mehreren Stationen.
Für diesen Step reicht die Nutzungsperspektive: Frage stellen, relevante Stellen finden, Kontextpaket bauen, Antwort formulieren und Quellen prüfen.
RAG ist ein Antwortablauf: Frage stellen, Quellen suchen, Kontextpaket bauen, Antwort formulieren.
Suche nach relevantem Kontext.
Anreicherung des Prompts mit gefundenem Kontext.
Antworterzeugung durch das LLM.
Dokument, Abschnitt oder Dateneinheit, auf die sich die Antwort stützt.
Ein Mitarbeiter fragt: "Wie oft müssen kritische Kundensysteme geprüft werden?" In einem einfachen RAG-System passiert zur Laufzeit ungefähr Folgendes:
Zuerst sucht das System nach relevanten Quellen: die Richtlinie A, eventuell ein Compliance-FAQ. Dann werden die passendsten Abschnitte in ein Kontextpaket gelegt. Das LLM bekommt Frage und Kontext und formuliert eine Antwort, idealerweise mit Quelle.
Jetzt wird sichtbar, warum RAG eine Pipeline ist. Die Richtlinie muss indexiert sein, Begriffe wie "kritische Kundensysteme" und "Kundensystem" sollten zusammenfinden, und das Kontextpaket braucht genug Fokus auf den relevanten Abschnitt.
Eine gute RAG-Antwort wäre konkret: "Kritische Kundensysteme müssen jährlich geprüft werden. Quelle: Richtlinie für kritische Kundensysteme, Abschnitt 4.2."
Diese Frage beantwortet RAG gut, weil die Antwort in einem auffindbaren Abschnitt steht. Sobald die Frage zusätzlich wissen will, welche Projekte betroffen sind, reicht ein Textabschnitt nicht mehr – darauf kommen die nächsten Steps zurück.
Der typische Denkfehler ist: "Wir hängen einfach Dokumente an den Prompt, dann ist es RAG." Echte RAG-Qualität entsteht durch passenden Kontext.
Ein zweiter Denkfehler ist, nur die finale Antwort zu bewerten. Wenn eine Antwort schwach ist, solltest du lokalisieren können, ob Retrieval, Chunking, Kontextauswahl, Prompt oder Modellverhalten verantwortlich war.
RAG ist sinnvoll, wenn Antworten auf einer kontrollierbaren Wissensbasis beruhen sollen und die relevanten Informationen überwiegend in Dokumenten, Abschnitten oder Datenquellen liegen.
GraphRAG wird als Erweiterung interessant, wenn Quellen plus Beziehungen, Pfade oder fachliche Abhängigkeiten gebraucht werden.
Baue eine kleine RAG-Skizze für diese Frage: "Wie oft müssen kritische Kundensysteme geprüft werden?"
Notiere vier Stationen: Frage, Retrieval, Kontextpaket, Antwort. Schreibe zu jeder Station einen Prüfpunkt auf.
"Wie oft müssen kritische Kundensysteme geprüft werden?"
Das System sucht in der Richtlinie A und einem Compliance-FAQ. Prüfpunkt: Wurde die aktuell gültige Fassung der Richtlinie gefunden?
Der relevante Abschnitt 4.2 wird zusammen mit der Frage an das LLM gegeben. Prüfpunkt: Enthält das Paket die konkrete Prüfpflicht und den Quellenabschnitt?
Das LLM formuliert eine konkrete Aussage. Prüfpunkt: Nennt die Antwort den Prüfrhythmus und die Quelle?
"Kritische Kundensysteme müssen jährlich geprüft werden. Quelle: Richtlinie für kritische Kundensysteme, Abschnitt 4.2."
Retrieval bedeutet, vor der Antwort relevante externe Informationen zu suchen, zum Beispiel Dokumentabschnitte, Datenbankeinträge oder später auch Graphkontext.
Von den gefundenen Quellen, der Kontextauswahl, der Berechtigungslogik und der Interpretation durch das LLM. Retrieval-Fehler können die Antwortqualität direkt beeinflussen.
Eine Quelle zu finden heißt, potenziell relevanten Kontext bereitzustellen. Eine Antwort zu begründen heißt, transparent zu zeigen, wie die Aussage aus Quelle, Kontext und ggf. Beziehungspfad folgt.
Kernaussage
RAG macht LLM-Antworten quellenbezogener; die Qualität hängt an der gesamten Pipeline.