Naive RAG
Frage einbetten, Top-k-Chunks holen, Antwort generieren. Das ist der einfachste Startpunkt und eine sinnvolle Baseline.
Deep Dive · Retrieval
Retrieval entscheidet, welcher Kontext vor der Antwort gefunden wird. Gute RAG-Qualität wächst aus Embeddings, Quellenarbeit, Ranking und einer passenden Suchstrategie für die jeweilige Frageklasse.
Anfängerfreundlicher Orientierungsstand · Mai 2026
Retrieval heißt: Das System sucht vor der Antwort nach passenden Informationen. Das können Textstellen, Datenbankeinträge, Metadaten, Entitäten, Beziehungspfade oder frühere Agentenkontexte sein.
Für Anfänger ist die wichtigste Unterscheidung einfach: findet ähnliche Textstellen, kombiniert mehrere Suchsignale, und ergänzt Beziehungen und Pfade. Der Knowledge Graph wird dabei zu einem zusätzlichen Retrieval-Signal für strukturierte Kontextauswahl.
Viele Systeme wachsen über eine Leiter: erst Baseline, dann Kombination, dann Beziehungen, dann adaptive Suche.
Frage einbetten, Top-k-Chunks holen, Antwort generieren. Das ist der einfachste Startpunkt und eine sinnvolle Baseline.
Vektor-, Keyword- und Filter-Signale werden kombiniert. Ein Reranker sortiert die Kandidaten nach der konkreten Frage neu.
Der Graph ergänzt Entitäten, Nachbarschaften, Beziehungspfade oder abhängige Objekte, wenn die Antwort aus Zusammenhängen entsteht.
Ein Agent entscheidet, welche Suche nötig ist, prüft Lücken und startet bei Bedarf eine zweite oder dritte Suche.
Jede Strategie löst ein bestimmtes Retrieval-Problem. Gute Architektur beginnt damit, das Problem sauber zu benennen und die passende nächste Ausbaustufe zu wählen.
Schnelle Baseline für einfache Fragen.
Das System holt die k ähnlichsten Treffer aus dem Index.
Beispiel: K = 10 liefert die zehn ähnlichsten Chunks.
Achtung: Ein gut gewähltes k balanciert Kontextabdeckung und Prompt-Fokus.
Der Suchraum muss vorab eingegrenzt werden.
Filter begrenzen Treffer nach Sprache, Quelle, Version, Datum, Kategorie oder Berechtigung.
Beispiel: Deutschsprachige Handbücher aus 2025 und Kategorie Camper.
Achtung: Gute Filter halten den Suchraum eng und lassen relevante Quellen erreichbar.
Mehrere Suchsignale verbessern die Kontextauswahl.
BM25, Vektorsuche, Filter und optional Graphsignale werden zusammengeführt.
Beispiel: BM25 findet TH080, Vektorsuche findet Batterieheizung und Winterbetrieb.
Achtung: Fusion wird belastbar, wenn jedes Signal gegen echte Fragen geprüft wird.
Relevante Kandidaten sollen weiter oben in der Trefferliste stehen.
Ein zweites Modell bewertet Kandidaten neu gegen die konkrete Frage.
Beispiel: Top 100 Kandidaten werden zu Top 10 wirklich relevanten Treffern.
Achtung: Reranking kostet zusätzliche Latenz und sollte sichtbar evaluiert werden.
Kleine Chunks finden präzise, verlieren aber Lesekontext.
Gesucht wird auf kleinen Chunks; zurückgegeben wird ein größerer Elternabschnitt.
Beispiel: Gefunden wird Abschnitt 2.4, gegeben wird das ganze Kapitel 2.
Achtung: Der Elternkontext sollte groß genug für Verständnis und klein genug für Fokus bleiben.
Eine Frage hat mehrere mögliche Suchrichtungen.
Das System erzeugt mehrere Suchanfragen und führt die Treffer zusammen.
Beispiel: Batterieüberwachung, Victron Shunt, Ladestand und Temperatursensor.
Achtung: Mehr Suchanfragen erhöhen Abdeckung, aber auch Duplikate und Kosten.
Die Nutzerfrage ist zu knapp oder verwendet andere Begriffe als die Quellen.
Suchbegriffe werden um Synonyme, Fachbegriffe oder verwandte Konzepte ergänzt.
Beispiel: Camper Batterie wird zu Akku, LiFePO4, Stromversorgung und Batteriesystem.
Achtung: Gute Expansion bleibt nah an der ursprünglichen Absicht der Frage.
Die Antwort entsteht aus Beziehungen zwischen Dingen.
Gefundene Entitäten führen zu Nachbarschaften, Pfaden, Konzepten oder verknüpften Dokumenten.
Beispiel: Victron -> Cerbo GX -> Modbus -> Home Assistant.
Achtung: Ein Pfad ist nur nützlich, wenn er zur Frage passt und durch Quellen belegbar ist.
Die Suchstrategie entsteht schrittweise während der Bearbeitung.
Ein Agent wählt Suchwege, prüft Lücken und startet bei Bedarf eine weitere Suche.
Beispiel: Erst Suche, dann Lückenprüfung, dann zweite Suche mit engerem Filter.
Achtung: Agentische Suche braucht klare Stop-Regeln, Traces und Kostenkontrolle.
Diese Signale helfen beim Einordnen. Evaluation macht anschließend sichtbar, ob GraphRAG, Reranking oder agentische Suche zur Frageklasse passen.
Eine Quelle reicht
Top-k oder einfache RAG-Baseline
Exakte IDs, Produktnamen oder Fehlercodes sind wichtig
Keyword/BM25 plus Vektor
Version, Sprache, Zeitraum oder Berechtigung entscheiden
Metadatenfilter zuerst
Treffer sind ähnlich, aber oft fachlich falsch
Reranking und Golden Questions
Der Treffer ist klein, die Erklärung braucht mehr Kontext
Parent-Child Retrieval
Die Frage verbindet mehrere Objekte oder Quellen
Graph Retrieval oder Hybrid Retrieval
Die erste Suche zeigt noch offene Kontextlücken
Agentic Retrieval mit Lückenprüfung
GraphRAG besteht aus mehreren praktischen Suchwegen. In Neo4j-nahen GraphRAG-Architekturen sieht man vier Muster: Textstellen führen in den Graph, Entitäten öffnen lokale Nachbarschaften, Cluster liefern Überblick und Graphabfragen beantworten konkrete Beziehungsmuster.
Vektorsuche findet relevante Chunks. Danach erweitert der Graph den Kontext über verbundene Entitäten, Quellen oder Multi-Hop-Beziehungen.
Beispiel: Chunk zur Reporting API -> erwähnte Services -> abhängige Kundenprozesse.
Die Suche startet bei einer Entität. Von dort werden Textstellen, Fakten, Claims, Nachbarschaften oder Pfade geladen.
Beispiel: Kunde Nordstern -> Verträge -> Klauseln -> Datenschutz-Policy.
Topic-Cluster oder Community-Summaries helfen bei Überblicksfragen über große Korpora.
Beispiel: Welche Hauptthemen ziehen sich durch alle Risiko-Reports?
Ein LLM übersetzt Frage und Graphschema in eine kontrollierte Graphabfrage. Das ist nützlich, wenn die Antwort als präzises Beziehungsmuster gesucht wird.
Beispiel: Welche Kunden haben Verträge mit Klauseln, die Policy X betreffen?
Die Frage „Wie überwache ich meine Batterie im Camper?“ kann je nach Datenlage mehrere Strategien brauchen. Genau daran sieht man, wie Retrieval von einer einfachen Vektorsuche zu einer kontrollierten Kontextstrategie wächst.
Findet ähnliche Chunks zu Batterie und Camper.
BM25 hält Begriffe wie TH080, Victron oder Shunt fest; Vektorsuche findet verwandte Beschreibungen.
Begrenzt auf Sprache Deutsch, Baujahr 2025 und Dokumenttyp Handbuch.
Sortiert Treffer auf die Absicht der Frage: Batterie überwachen.
Verbindet Batterie, Shunt, Cerbo GX, Sensoren und Home Assistant über Beziehungspfade.
Ein Knowledge Graph speichert Beziehungen. Retrieval entscheidet, welche dieser Beziehungen zur Frage passen und in das Kontextpaket kommen. Die GraphRAG Retrieval Patterns zeigen, ob diese Suche bei Chunks, Entitäten, kombinierten Signalen, Cypher oder einem Agentenplan startet.