Deep Dive · GraphRAG Patterns

GraphRAG Retrieval Patterns als Entscheidungskarte

GraphRAG ist kein einzelner Ablauf. Es ist eine Familie von Mustern, die unterschiedlich starten, unterschiedliche Systemschichten verantwortlich machen und unterschiedliche Risiken erzeugen.

Chunk-first

Entity-first

Hybrid

Text-to-Cypher

Agentic

Pattern-Ebene für Architekturentscheidungen · Juni 2026

Die Grundidee

GraphRAG wird verständlich, wenn die Frage nach dem Graphen von der Frage nach dem Retrieval getrennt wird. Ein -System kann mit Dokument-Graph, Domänen-Graph, Knowledge Graph oder dynamischem Kontext arbeiten. Das Retrieval Pattern entscheidet, wie eine Nutzerfrage daraus belastbaren Kontext holt.

Der gleiche Graph kann also in mehreren Mustern genutzt werden: einmal als Nachbarschaftserweiterung nach Chunk-Suche, einmal als Startpunkt für Entitäten, einmal als Cypher-Ziel oder als Werkzeug in einem agentischen Ablauf.

Drei Ebenen, drei Verantwortungen

Diese Trennung verhindert, dass Tooling, Datenmodell und Antwortqualität in einen einzigen Begriff rutschen.

Was ist im Graph modelliert?

Graph-Typen

Dokumente, Chunks, Entitäten, fachliche Objekte, Gesprächskontext oder zeitliche Veränderungen.

Wie wird Kontext geholt?

Retrieval Patterns

Die Pipeline entscheidet, ob sie bei Chunks, Entitäten, mehreren Signalen, Cypher oder einem Agentenplan startet.

Wie wird daraus Antworttext?

Antwortsynthese

Das LLM formuliert aus Belegen, Pfaden, Tabellen oder Zwischenergebnissen eine nachvollziehbare Antwort.

Entscheidungslandkarte

Die Patterns unterscheiden sich vor allem im Startpunkt und darin, welche Schicht die größte Verantwortung trägt. Für Architekturentscheidungen ist das wichtiger als der Name des eingesetzten Tools.

Pattern	Startpunkt	App	Vector Index	Neo4j/Cypher	LLM	Stärke	Risiko
Chunk-first	Ähnliche Textchunks	bettet die Frage ein und baut das Kontextpaket	primäres Startsignal	erweitert Treffer über Entitäten, Terms, Dokumente oder Nachbarn	antwortet aus Belegkontext	quellennahe Fragen in großen Korpora	ähnliche Chunks können fachlich am Ziel vorbeigehen
Entity-first	Entitäten oder Konzepte	normalisiert Begriffe und begrenzt Hops	hilft optional beim Entity Matching	liefert Nachbarschaften, Pfade und verbundene Quellen	erklärt Pfade und Belege	fachliche Abhängigkeiten bei brauchbarem Domänenmodell	schlechte Entity Resolution erzeugt falsche Pfade
Hybrid	mehrere Suchsignale	fusioniert, rerankt und beobachtet Signalbeiträge	liefert semantische Breite	liefert relationale Tiefe und Filter	nutzt gerankte Belege und Pfade	robuste produktionsnahe Kontextauswahl	Fusion wird ohne Evaluation zur Black Box
Text-to-Cypher	Graphschema und Frage	validiert Schema, Rechte und Query-Grenzen	meist Nebenrolle	führt strukturierte Cypher-Abfragen aus	plant oder erzeugt die Query und erklärt Ergebnisse	präzise strukturierte Fragen über Graphmuster	Query-Fehler, Schema-Missverständnisse und Halluzinationen
Agentic	Ziel, Lücke oder Arbeitsauftrag	setzt Tools, Budgets, Traces und Stop-Regeln	ein Werkzeug unter mehreren	ein Werkzeug für Pfade, Fakten und Nachbarschaften	orchestriert mehrere Schritte	komplexe Aufgaben mit iterativer Kontextsuche	Kosten, Kontrollverlust und schwer prüfbare Zwischenschritte

Die fünf Patterns

Jedes Pattern ist ein anderer Weg durch dieselben Grundbausteine: App-Orchestrierung, Index, Graph, Query-Schicht und LLM.

Chunk-first GraphRAG

auch: Text-based Retrieval

Frage -> Frage-Embedding -> ähnliche Chunks -> Graphnachbarn, Entitäten, Terms oder Dokumente -> Belegkontext -> Antwort

Gut für: Quellenbezogene Fragen, große Textkorpora und einen pragmatischen Ausbau von Vector-only RAG.

Achtung: Vector Search allein ist noch Vector-only RAG. Zum GraphRAG-Pattern wird der Ablauf erst, wenn Treffer über Beziehungen erweitert, geprüft oder erklärt werden.

Verantwortung: Die App hält den Ablauf zusammen; der Vector Index findet Kandidaten; Neo4j liefert Nachbarschaft; das LLM formuliert.

Entity-first GraphRAG

auch: Local Search (Microsoft GraphRAG)

Frage -> Entitäten oder Konzepte bestimmen -> 2 bis 3 Hops laufen -> relevante Pfade wählen -> Dokumente oder Chunks holen -> Antwort

Gut für: Domänen mit gepflegter Ontologie, stabilen Fachobjekten und Fragen nach Abhängigkeiten.

Achtung: Das Pattern steht und fällt mit Entity Resolution, Beziehungstypen und Hop-Grenzen. Mehr Pfade bedeuten nicht automatisch besseren Kontext.

Verantwortung: Die App normalisiert die Frage; Neo4j traversiert den Graph; der Vector Index ergänzt Quellen; das LLM erklärt die Verbindung.

Hybrid Retrieval GraphRAG

Frage -> Chunks suchen + Entitäten suchen + Filter oder Cypher nutzen -> fusionieren und reranken -> Belege und Pfade -> Antwort

Gut für: Produktionsnahe Systeme, in denen kein einzelnes Signal zuverlässig genug ist.

Achtung: Hybrid braucht Ablation: Es muss sichtbar werden, ob Vektor, Keyword, Filter, Graph oder Reranking die Antwort wirklich verbessert.

Verantwortung: Die App bewertet Signale; Indizes liefern Kandidaten; Neo4j liefert Struktur; das LLM bleibt Antwortgenerator.

Text-to-Cypher GraphQA

auch: NL2Cypher

Frage -> LLM plant oder erzeugt Cypher -> Neo4j liefert strukturierte Ergebnisse -> LLM erklärt Ergebnis und Grenzen

Gut für: Fragen, die als klares Graphmuster beantwortbar sind: Wer ist verbunden mit was, über welche Beziehung, in welchem Zustand?

Achtung: Das LLM ist hier Query-Planer. Deshalb braucht es Schema-Kontext, erlaubte Query-Muster, Validierung und gute Fehlermeldungen.

Verantwortung: Die App begrenzt und validiert; das LLM plant; Neo4j führt aus; die Antwort muss Ergebnis und Query-Logik trennen.

Agentic GraphRAG

Frage oder Ziel -> Agent plant Schritte -> nutzt Vector Search, Cypher und Tools -> prüft Lücken -> antwortet

Gut für: Mehrstufige Aufgaben, bei denen die richtige Suchstrategie erst während der Bearbeitung sichtbar wird.

Achtung: Agentisch heißt nicht automatisch besser. Ohne Traces, Budgets, Stop-Regeln und Tool-Grenzen wird Retrieval schwer kontrollierbar.

Verantwortung: Die App setzt Leitplanken; der Agent orchestriert; Werkzeuge liefern Daten; das LLM synthetisiert und begründet.

Welches Pattern passt?

Die beste Entscheidung beginnt bei der Frageklasse. Erst danach lohnt sich die Diskussion über Graphschema, Index, Cypher oder Agenten.

Die Frage sucht konkrete Textbelege.

Chunk-first

Die Frage startet bei bekannten Fachobjekten.

Entity-first

Textnähe, Filter und Beziehungen müssen zusammenwirken.

Hybrid

Die Antwort ist ein präzises Graphmuster oder eine Liste.

Text-to-Cypher

Die Aufgabe braucht mehrere Such- und Prüfschritte.

Agentic

Einordnung

GraphRAG beginnt nicht bei Neo4j, sondern bei der Kontextfrage

Neo4j kann Graph Store, Cypher-Schicht und Vector Index in einem System verbinden. Architekturentscheidend bleibt aber, ob eine Frage Textnähe, Entitäten, strukturierte Queries, kombinierte Signale oder agentische Planung braucht.

Nächste Schritte

Nächstes Konzept: GraphRAG GraphRAG Hybrid Retrieval

Die Grundidee

Pattern

Startpunkt

App

Vector Index

Neo4j/Cypher

LLM

Stärke

Risiko

Chunk-first

Ähnliche Textchunks

bettet die Frage ein und baut das Kontextpaket

primäres Startsignal

erweitert Treffer über Entitäten, Terms, Dokumente oder Nachbarn

antwortet aus Belegkontext

quellennahe Fragen in großen Korpora

ähnliche Chunks können fachlich am Ziel vorbeigehen

Entity-first

Entitäten oder Konzepte

normalisiert Begriffe und begrenzt Hops

hilft optional beim Entity Matching

liefert Nachbarschaften, Pfade und verbundene Quellen

erklärt Pfade und Belege

fachliche Abhängigkeiten bei brauchbarem Domänenmodell

schlechte Entity Resolution erzeugt falsche Pfade

Hybrid

mehrere Suchsignale

fusioniert, rerankt und beobachtet Signalbeiträge

liefert semantische Breite

liefert relationale Tiefe und Filter

nutzt gerankte Belege und Pfade

robuste produktionsnahe Kontextauswahl

Fusion wird ohne Evaluation zur Black Box

Text-to-Cypher

Graphschema und Frage

validiert Schema, Rechte und Query-Grenzen

meist Nebenrolle

führt strukturierte Cypher-Abfragen aus

plant oder erzeugt die Query und erklärt Ergebnisse

präzise strukturierte Fragen über Graphmuster

Query-Fehler, Schema-Missverständnisse und Halluzinationen

Agentic

Ziel, Lücke oder Arbeitsauftrag

setzt Tools, Budgets, Traces und Stop-Regeln

ein Werkzeug unter mehreren

ein Werkzeug für Pfade, Fakten und Nachbarschaften

orchestriert mehrere Schritte

komplexe Aufgaben mit iterativer Kontextsuche

Kosten, Kontrollverlust und schwer prüfbare Zwischenschritte