Deep Dive · Retrieval

Retrieval-Strategien als Entscheidungskarte

Retrieval entscheidet, welcher Kontext vor der Antwort gefunden wird. Gute RAG-Qualität wächst aus Embeddings, Quellenarbeit, Ranking und einer passenden Suchstrategie für die jeweilige Frageklasse.

Top-k

Hybrid

Reranking

Graph Retrieval

Anfängerfreundlicher Orientierungsstand · Juni 2026

Die Grundidee

Retrieval heißt: Das System sucht vor der Antwort nach passenden Informationen. Das können Textstellen, Datenbankeinträge, Metadaten, Entitäten, Beziehungspfade oder frühere Agentenkontexte sein.

Für Anfänger ist die wichtigste Unterscheidung einfach: findet ähnliche Textstellen, kombiniert mehrere Suchsignale, und ergänzt Beziehungen und Pfade. Der Knowledge Graph wird dabei zu einem zusätzlichen Retrieval-Signal für strukturierte Kontextauswahl.

Vier Reifegrade

Viele Systeme wachsen über eine Leiter: erst Baseline, dann Kombination, dann Beziehungen, dann adaptive Suche.

Naive RAG

Frage einbetten, Top-k-Chunks holen, Antwort generieren. Das ist der einfachste Startpunkt und eine sinnvolle Baseline.

Hybrid + Reranking

Vektor-, Keyword- und Filter-Signale werden kombiniert. Ein Reranker sortiert die Kandidaten nach der konkreten Frage neu.

Graph Retrieval

Der Graph ergänzt Entitäten, Nachbarschaften, Beziehungspfade oder abhängige Objekte, wenn die Antwort aus Zusammenhängen entsteht.

Agentic Retrieval

Ein Agent entscheidet, welche Suche nötig ist, prüft Lücken und startet bei Bedarf eine zweite oder dritte Suche.

Strategien nach Problemtyp

Jede Strategie löst ein bestimmtes Retrieval-Problem. Gute Architektur beginnt damit, das Problem sauber zu benennen und die passende nächste Ausbaustufe zu wählen.

Top-k Retrieval

Schnelle Baseline für einfache Fragen.

Das System holt die k ähnlichsten Treffer aus dem Index.

Beispiel: K = 10 liefert die zehn ähnlichsten Chunks.

Achtung: Ein gut gewähltes k balanciert Kontextabdeckung und Prompt-Fokus.

Metadata Filtering

Der Suchraum muss vorab eingegrenzt werden.

Filter begrenzen Treffer nach Sprache, Quelle, Version, Datum, Kategorie oder Berechtigung.

Beispiel: Deutschsprachige Handbücher aus 2025 und Kategorie Camper.

Achtung: Gute Filter halten den Suchraum eng und lassen relevante Quellen erreichbar.

Hybrid Retrieval

Mehrere Suchsignale verbessern die Kontextauswahl.

BM25, Vektorsuche, Filter und optional Graphsignale werden zusammengeführt.

Beispiel: BM25 findet TH080, Vektorsuche findet Batterieheizung und Winterbetrieb.

Achtung: Fusion wird belastbar, wenn jedes Signal gegen echte Fragen geprüft wird.

Reranking

Relevante Kandidaten sollen weiter oben in der Trefferliste stehen.

Ein zweites Modell bewertet Kandidaten neu gegen die konkrete Frage.

Beispiel: Top 100 Kandidaten werden zu Top 10 wirklich relevanten Treffern.

Achtung: Reranking kostet zusätzliche Latenz und sollte sichtbar evaluiert werden.

Parent-Child Retrieval

Kleine Chunks finden präzise, verlieren aber Lesekontext.

Gesucht wird auf kleinen Chunks; zurückgegeben wird ein größerer Elternabschnitt.

Beispiel: Gefunden wird Abschnitt 2.4, gegeben wird das ganze Kapitel 2.

Achtung: Der Elternkontext sollte groß genug für Verständnis und klein genug für Fokus bleiben.

Multi Query Retrieval

Eine Frage hat mehrere mögliche Suchrichtungen.

Das System erzeugt mehrere Suchanfragen und führt die Treffer zusammen.

Beispiel: Batterieüberwachung, Victron Shunt, Ladestand und Temperatursensor.

Achtung: Mehr Suchanfragen erhöhen Abdeckung, aber auch Duplikate und Kosten.

Query Expansion

Die Nutzerfrage ist zu knapp oder verwendet andere Begriffe als die Quellen.

Suchbegriffe werden um Synonyme, Fachbegriffe oder verwandte Konzepte ergänzt.

Beispiel: Camper Batterie wird zu Akku, LiFePO4, Stromversorgung und Batteriesystem.

Achtung: Gute Expansion bleibt nah an der ursprünglichen Absicht der Frage.

Graph Retrieval

Die Antwort entsteht aus Beziehungen zwischen Dingen.

Gefundene Entitäten führen zu Nachbarschaften, Pfaden, Konzepten oder verknüpften Dokumenten.

Beispiel: Victron -> Cerbo GX -> Modbus -> Home Assistant.

Achtung: Ein Pfad ist nur nützlich, wenn er zur Frage passt und durch Quellen belegbar ist.

Agentic Retrieval

Die Suchstrategie entsteht schrittweise während der Bearbeitung.

Ein Agent wählt Suchwege, prüft Lücken und startet bei Bedarf eine weitere Suche.

Beispiel: Erst Suche, dann Lückenprüfung, dann zweite Suche mit engerem Filter.

Achtung: Agentische Suche braucht klare Stop-Regeln, Traces und Kostenkontrolle.

Welche Strategie passt?

Diese Signale helfen beim Einordnen. Evaluation macht anschließend sichtbar, ob GraphRAG, Reranking oder agentische Suche zur Frageklasse passen.

Eine Quelle reicht

Top-k oder einfache RAG-Baseline

Exakte IDs, Produktnamen oder Fehlercodes sind wichtig

Keyword/BM25 plus Vektor

Version, Sprache, Zeitraum oder Berechtigung entscheiden

Metadatenfilter zuerst

Treffer sind ähnlich, aber oft fachlich falsch

Reranking und Golden Questions

Der Treffer ist klein, die Erklärung braucht mehr Kontext

Parent-Child Retrieval

Die Frage verbindet mehrere Objekte oder Quellen

Graph Retrieval oder Hybrid Retrieval

Die erste Suche zeigt noch offene Kontextlücken

Agentic Retrieval mit Lückenprüfung

GraphRAG-Retrieval-Modi

GraphRAG besteht aus mehreren praktischen Suchwegen. In Neo4j-nahen GraphRAG-Architekturen sieht man vier Muster: Textstellen führen in den Graph, Entitäten öffnen lokale Nachbarschaften, Cluster liefern Überblick und Graphabfragen beantworten konkrete Beziehungsmuster.

Textbasiert: Vector + Graph

Vektorsuche findet relevante Chunks. Danach erweitert der Graph den Kontext über verbundene Entitäten, Quellen oder Multi-Hop-Beziehungen.

Beispiel: Chunk zur Reporting API -> erwähnte Services -> abhängige Kundenprozesse.

Entitätsbasiert: Local Retrieval

Die Suche startet bei einer Entität. Von dort werden Textstellen, Fakten, Claims, Nachbarschaften oder Pfade geladen.

Beispiel: Kunde Nordstern -> Verträge -> Klauseln -> Datenschutz-Policy.

Clusterbasiert: Global Retrieval

Topic-Cluster oder Community-Summaries helfen bei Überblicksfragen über große Korpora.

Beispiel: Welche Hauptthemen ziehen sich durch alle Risiko-Reports?

Querybasiert: NL2Cypher

Ein LLM übersetzt Frage und Graphschema in eine kontrollierte Graphabfrage. Das ist nützlich, wenn die Antwort als präzises Beziehungsmuster gesucht wird.

Beispiel: Welche Kunden haben Verträge mit Klauseln, die Policy X betreffen?

Mini-Beispiel: Camper-Batterie

Die Frage „Wie überwache ich meine Batterie im Camper?“ kann je nach Datenlage mehrere Strategien brauchen. Genau daran sieht man, wie Retrieval von einer einfachen Vektorsuche zu einer kontrollierten Kontextstrategie wächst.

Naive RAG

Findet ähnliche Chunks zu Batterie und Camper.

Hybrid

BM25 hält Begriffe wie TH080, Victron oder Shunt fest; Vektorsuche findet verwandte Beschreibungen.

Filter

Begrenzt auf Sprache Deutsch, Baujahr 2025 und Dokumenttyp Handbuch.

Reranking

Sortiert Treffer auf die Absicht der Frage: Batterie überwachen.

Graph

Verbindet Batterie, Shunt, Cerbo GX, Sensoren und Home Assistant über Beziehungspfade.

GraphRAG-Einordnung

Der Graph als Retrieval-Signal

Ein Knowledge Graph speichert Beziehungen. Retrieval entscheidet, welche dieser Beziehungen zur Frage passen und in das Kontextpaket kommen. Die GraphRAG Retrieval Patterns zeigen, ob diese Suche bei Chunks, Entitäten, kombinierten Signalen, Cypher oder einem Agentenplan startet.

Zurück zur Übersicht Nächstes Konzept: GraphRAG Retrieval Patterns

Die Grundidee

Vier Reifegrade

Viele Systeme wachsen über eine Leiter: erst Baseline, dann Kombination, dann Beziehungen, dann adaptive Suche.

Naive RAG

Frage einbetten, Top-k-Chunks holen, Antwort generieren. Das ist der einfachste Startpunkt und eine sinnvolle Baseline.

Hybrid + Reranking

Vektor-, Keyword- und Filter-Signale werden kombiniert. Ein Reranker sortiert die Kandidaten nach der konkreten Frage neu.

Graph Retrieval

Der Graph ergänzt Entitäten, Nachbarschaften, Beziehungspfade oder abhängige Objekte, wenn die Antwort aus Zusammenhängen entsteht.

Agentic Retrieval

Ein Agent entscheidet, welche Suche nötig ist, prüft Lücken und startet bei Bedarf eine zweite oder dritte Suche.

Strategien nach Problemtyp

Jede Strategie löst ein bestimmtes Retrieval-Problem. Gute Architektur beginnt damit, das Problem sauber zu benennen und die passende nächste Ausbaustufe zu wählen.

Top-k Retrieval

Schnelle Baseline für einfache Fragen.

Das System holt die k ähnlichsten Treffer aus dem Index.

Beispiel: K = 10 liefert die zehn ähnlichsten Chunks.

Achtung: Ein gut gewähltes k balanciert Kontextabdeckung und Prompt-Fokus.

Metadata Filtering

Der Suchraum muss vorab eingegrenzt werden.

Filter begrenzen Treffer nach Sprache, Quelle, Version, Datum, Kategorie oder Berechtigung.

Beispiel: Deutschsprachige Handbücher aus 2025 und Kategorie Camper.

Achtung: Gute Filter halten den Suchraum eng und lassen relevante Quellen erreichbar.

Hybrid Retrieval

Mehrere Suchsignale verbessern die Kontextauswahl.

BM25, Vektorsuche, Filter und optional Graphsignale werden zusammengeführt.

Beispiel: BM25 findet TH080, Vektorsuche findet Batterieheizung und Winterbetrieb.

Achtung: Fusion wird belastbar, wenn jedes Signal gegen echte Fragen geprüft wird.

Reranking

Relevante Kandidaten sollen weiter oben in der Trefferliste stehen.

Ein zweites Modell bewertet Kandidaten neu gegen die konkrete Frage.

Beispiel: Top 100 Kandidaten werden zu Top 10 wirklich relevanten Treffern.

Achtung: Reranking kostet zusätzliche Latenz und sollte sichtbar evaluiert werden.

Parent-Child Retrieval

Kleine Chunks finden präzise, verlieren aber Lesekontext.

Gesucht wird auf kleinen Chunks; zurückgegeben wird ein größerer Elternabschnitt.

Beispiel: Gefunden wird Abschnitt 2.4, gegeben wird das ganze Kapitel 2.

Achtung: Der Elternkontext sollte groß genug für Verständnis und klein genug für Fokus bleiben.

Multi Query Retrieval

Eine Frage hat mehrere mögliche Suchrichtungen.

Das System erzeugt mehrere Suchanfragen und führt die Treffer zusammen.

Beispiel: Batterieüberwachung, Victron Shunt, Ladestand und Temperatursensor.

Achtung: Mehr Suchanfragen erhöhen Abdeckung, aber auch Duplikate und Kosten.

Query Expansion

Die Nutzerfrage ist zu knapp oder verwendet andere Begriffe als die Quellen.

Suchbegriffe werden um Synonyme, Fachbegriffe oder verwandte Konzepte ergänzt.

Beispiel: Camper Batterie wird zu Akku, LiFePO4, Stromversorgung und Batteriesystem.

Achtung: Gute Expansion bleibt nah an der ursprünglichen Absicht der Frage.

Graph Retrieval

Die Antwort entsteht aus Beziehungen zwischen Dingen.

Gefundene Entitäten führen zu Nachbarschaften, Pfaden, Konzepten oder verknüpften Dokumenten.

Beispiel: Victron -> Cerbo GX -> Modbus -> Home Assistant.

Achtung: Ein Pfad ist nur nützlich, wenn er zur Frage passt und durch Quellen belegbar ist.

Agentic Retrieval

Die Suchstrategie entsteht schrittweise während der Bearbeitung.

Ein Agent wählt Suchwege, prüft Lücken und startet bei Bedarf eine weitere Suche.

Beispiel: Erst Suche, dann Lückenprüfung, dann zweite Suche mit engerem Filter.

Achtung: Agentische Suche braucht klare Stop-Regeln, Traces und Kostenkontrolle.