Phase 1 · Step 4 von 9 · Lesezeit ca. 4 Min.

Was RAG ist

Du lernst den Ablauf kennen: Frage, Suche, Kontextpaket und Antwort.

Was du mitnimmst

RAG macht LLM-Antworten quellenbezogener; die Qualität hängt an der gesamten Pipeline.

Lernziel

Du lernst RAG als einfachen Laufzeit-Ablauf kennen: Eine Frage kommt rein, passende Quellen werden gesucht, ein Kontextpaket wird gebaut und das LLM formuliert daraus eine Antwort. Danach erkennst du, an welchen Stationen Antwortqualität entsteht.

Erklärung

RAG beantwortet eine einfache Kernfrage: Wie bekommt ein LLM genau die Informationen, die es für diese Antwort braucht?

Der Ablauf ist kurz: suchen, Kontext beilegen, antworten lassen. In der Praxis entscheidet jede Station darüber, ob die Antwort hilfreich, aktuell und belegbar wird.

Dieser Schritt zeigt den Grundablauf, auf dem GraphRAG später aufsetzt. Wenn dieser Ablauf unklar bleibt, verschwimmen Suche, Kontextpaket und Antwortformulierung zu einem einzigen schwer prüfbaren Vorgang.

RAG steht für Retrieval-Augmented Generation. Retrieval sucht passende Quellen oder Textabschnitte. Augmentation legt die gefundenen Informationen als Kontext zur Frage. Generation formuliert daraus eine Antwort.

Diese Pipeline macht Wissen kontrollierbarer: Dokumente können aktualisiert, Quellen können angezeigt und Suchqualität kann gemessen werden. Das macht RAG für Unternehmenswissen so attraktiv.

RAG verbessert Antworten, wenn Quellen, Berechtigungen, Kontextauswahl und Modellinterpretation zusammenpassen. Die Antwortqualität hängt deshalb an mehreren Stationen.

Für diesen Step reicht die Nutzungsperspektive: Frage stellen, relevante Stellen finden, Kontextpaket bauen, Antwort formulieren und Quellen prüfen.

Mentales Modell

RAG ist ein Antwortablauf: Frage stellen, Quellen suchen, Kontextpaket bauen, Antwort formulieren.

Begriffe

Retrieval

Suche nach relevantem Kontext.

Augmentation

Anreicherung des Prompts mit gefundenem Kontext.

Generation

Antworterzeugung durch das LLM.

Quelle

Dokument, Abschnitt oder Dateneinheit, auf die sich die Antwort stützt.

Beispiel

Ein Mitarbeiter fragt: "Wie oft müssen kritische Kundensysteme geprüft werden?" In einem einfachen RAG-System passiert zur Laufzeit ungefähr Folgendes:

Zuerst sucht das System nach relevanten Quellen: die Richtlinie A, eventuell ein Compliance-FAQ. Dann werden die passendsten Abschnitte in ein Kontextpaket gelegt. Das LLM bekommt Frage und Kontext und formuliert eine Antwort, idealerweise mit Quelle.

Jetzt wird sichtbar, warum RAG eine Pipeline ist. Die Richtlinie muss indexiert sein, Begriffe wie "kritische Kundensysteme" und "Kundensystem" sollten zusammenfinden, und das Kontextpaket braucht genug Fokus auf den relevanten Abschnitt.

Eine gute RAG-Antwort wäre konkret: "Kritische Kundensysteme müssen jährlich geprüft werden. Quelle: Richtlinie für kritische Kundensysteme, Abschnitt 4.2."

Diese Frage beantwortet RAG gut, weil die Antwort in einem auffindbaren Abschnitt steht. Sobald die Frage zusätzlich wissen will, welche Projekte betroffen sind, reicht ein Textabschnitt nicht mehr – darauf kommen die nächsten Steps zurück.

Typischer Denkfehler

Der typische Denkfehler ist: "Wir hängen einfach Dokumente an den Prompt, dann ist es RAG." Echte RAG-Qualität entsteht durch passenden Kontext.

Ein zweiter Denkfehler ist, nur die finale Antwort zu bewerten. Wenn eine Antwort schwach ist, solltest du lokalisieren können, ob Retrieval, Chunking, Kontextauswahl, Prompt oder Modellverhalten verantwortlich war.

Woran du es erkennst

RAG ist sinnvoll, wenn Antworten auf einer kontrollierbaren Wissensbasis beruhen sollen und die relevanten Informationen überwiegend in Dokumenten, Abschnitten oder Datenquellen liegen.

GraphRAG wird als Erweiterung interessant, wenn Quellen plus Beziehungen, Pfade oder fachliche Abhängigkeiten gebraucht werden.

Mini-Aufgabe

Baue eine kleine RAG-Skizze für diese Frage: "Wie oft müssen kritische Kundensysteme geprüft werden?"

Notiere vier Stationen: Frage, Retrieval, Kontextpaket, Antwort. Schreibe zu jeder Station einen Prüfpunkt auf.

Musterlösung

Frage

"Wie oft müssen kritische Kundensysteme geprüft werden?"

Retrieval

Das System sucht in der Richtlinie A und einem Compliance-FAQ. Prüfpunkt: Wurde die aktuell gültige Fassung der Richtlinie gefunden?

Kontextpaket

Der relevante Abschnitt 4.2 wird zusammen mit der Frage an das LLM gegeben. Prüfpunkt: Enthält das Paket die konkrete Prüfpflicht und den Quellenabschnitt?

Antwort

Das LLM formuliert eine konkrete Aussage. Prüfpunkt: Nennt die Antwort den Prüfrhythmus und die Quelle?

Beispielantwort

"Kritische Kundensysteme müssen jährlich geprüft werden. Quelle: Richtlinie für kritische Kundensysteme, Abschnitt 4.2."

Selbsttest

1.Was bedeutet Retrieval in RAG?

Retrieval bedeutet, vor der Antwort relevante externe Informationen zu suchen, zum Beispiel Dokumentabschnitte, Datenbankeinträge oder später auch Graphkontext.

2.Wovon hängt RAG-Qualität ab?

Von den gefundenen Quellen, der Kontextauswahl, der Berechtigungslogik und der Interpretation durch das LLM. Retrieval-Fehler können die Antwortqualität direkt beeinflussen.

3.Was ist der Unterschied zwischen Quelle finden und Antwort begründen?

Eine Quelle zu finden heißt, potenziell relevanten Kontext bereitzustellen. Eine Antwort zu begründen heißt, transparent zu zeigen, wie die Aussage aus Quelle, Kontext und ggf. Beziehungspfad folgt.

Kernaussage

RAG macht LLM-Antworten quellenbezogener; die Qualität hängt an der gesamten Pipeline.

Vorherige Lektion Nächste Lektion

Was RAG ist

Du lernst den Ablauf kennen: Frage, Suche, Kontextpaket und Antwort.

Was du mitnimmst

RAG macht LLM-Antworten quellenbezogener; die Qualität hängt an der gesamten Pipeline.

Lernziel

Erklärung

RAG beantwortet eine einfache Kernfrage: Wie bekommt ein LLM genau die Informationen, die es für diese Antwort braucht?

Der Ablauf ist kurz: suchen, Kontext beilegen, antworten lassen. In der Praxis entscheidet jede Station darüber, ob die Antwort hilfreich, aktuell und belegbar wird.

Diese Pipeline macht Wissen kontrollierbarer: Dokumente können aktualisiert, Quellen können angezeigt und Suchqualität kann gemessen werden. Das macht RAG für Unternehmenswissen so attraktiv.

RAG verbessert Antworten, wenn Quellen, Berechtigungen, Kontextauswahl und Modellinterpretation zusammenpassen. Die Antwortqualität hängt deshalb an mehreren Stationen.

Für diesen Step reicht die Nutzungsperspektive: Frage stellen, relevante Stellen finden, Kontextpaket bauen, Antwort formulieren und Quellen prüfen.

Mentales Modell

RAG ist ein Antwortablauf: Frage stellen, Quellen suchen, Kontextpaket bauen, Antwort formulieren.

Begriffe

Retrieval

Suche nach relevantem Kontext.

Augmentation

Anreicherung des Prompts mit gefundenem Kontext.

Generation

Antworterzeugung durch das LLM.

Quelle

Dokument, Abschnitt oder Dateneinheit, auf die sich die Antwort stützt.

Beispiel

Ein Mitarbeiter fragt: "Wie oft müssen kritische Kundensysteme geprüft werden?" In einem einfachen RAG-System passiert zur Laufzeit ungefähr Folgendes:

Eine gute RAG-Antwort wäre konkret: "Kritische Kundensysteme müssen jährlich geprüft werden. Quelle: Richtlinie für kritische Kundensysteme, Abschnitt 4.2."

Typischer Denkfehler

Der typische Denkfehler ist: "Wir hängen einfach Dokumente an den Prompt, dann ist es RAG." Echte RAG-Qualität entsteht durch passenden Kontext.

Woran du es erkennst

RAG ist sinnvoll, wenn Antworten auf einer kontrollierbaren Wissensbasis beruhen sollen und die relevanten Informationen überwiegend in Dokumenten, Abschnitten oder Datenquellen liegen.

GraphRAG wird als Erweiterung interessant, wenn Quellen plus Beziehungen, Pfade oder fachliche Abhängigkeiten gebraucht werden.

Mini-Aufgabe

Baue eine kleine RAG-Skizze für diese Frage: "Wie oft müssen kritische Kundensysteme geprüft werden?"

Notiere vier Stationen: Frage, Retrieval, Kontextpaket, Antwort. Schreibe zu jeder Station einen Prüfpunkt auf.

Musterlösung

Frage

"Wie oft müssen kritische Kundensysteme geprüft werden?"

Retrieval

Das System sucht in der Richtlinie A und einem Compliance-FAQ. Prüfpunkt: Wurde die aktuell gültige Fassung der Richtlinie gefunden?

Kontextpaket

Der relevante Abschnitt 4.2 wird zusammen mit der Frage an das LLM gegeben. Prüfpunkt: Enthält das Paket die konkrete Prüfpflicht und den Quellenabschnitt?

Antwort

Das LLM formuliert eine konkrete Aussage. Prüfpunkt: Nennt die Antwort den Prüfrhythmus und die Quelle?

Beispielantwort

"Kritische Kundensysteme müssen jährlich geprüft werden. Quelle: Richtlinie für kritische Kundensysteme, Abschnitt 4.2."

Selbsttest

1.Was bedeutet Retrieval in RAG?

Retrieval bedeutet, vor der Antwort relevante externe Informationen zu suchen, zum Beispiel Dokumentabschnitte, Datenbankeinträge oder später auch Graphkontext.

2.Wovon hängt RAG-Qualität ab?

Von den gefundenen Quellen, der Kontextauswahl, der Berechtigungslogik und der Interpretation durch das LLM. Retrieval-Fehler können die Antwortqualität direkt beeinflussen.

3.Was ist der Unterschied zwischen Quelle finden und Antwort begründen?

Kernaussage

RAG macht LLM-Antworten quellenbezogener; die Qualität hängt an der gesamten Pipeline.