Was ist im Graph modelliert?
Graph-Typen
Dokumente, Chunks, Entitäten, fachliche Objekte, Gesprächskontext oder zeitliche Veränderungen.
Deep Dive · GraphRAG Patterns
GraphRAG ist kein einzelner Ablauf. Es ist eine Familie von Mustern, die unterschiedlich starten, unterschiedliche Systemschichten verantwortlich machen und unterschiedliche Risiken erzeugen.
Pattern-Ebene für Architekturentscheidungen · Juni 2026
GraphRAG wird verständlich, wenn die Frage nach dem Graphen von der Frage nach dem Retrieval getrennt wird. Ein -System kann mit Dokument-Graph, Domänen-Graph, Knowledge Graph oder dynamischem Kontext arbeiten. Das Retrieval Pattern entscheidet, wie eine Nutzerfrage daraus belastbaren Kontext holt.
Der gleiche Graph kann also in mehreren Mustern genutzt werden: einmal als Nachbarschaftserweiterung nach Chunk-Suche, einmal als Startpunkt für Entitäten, einmal als Cypher-Ziel oder als Werkzeug in einem agentischen Ablauf.
Diese Trennung verhindert, dass Tooling, Datenmodell und Antwortqualität in einen einzigen Begriff rutschen.
Was ist im Graph modelliert?
Dokumente, Chunks, Entitäten, fachliche Objekte, Gesprächskontext oder zeitliche Veränderungen.
Wie wird Kontext geholt?
Die Pipeline entscheidet, ob sie bei Chunks, Entitäten, mehreren Signalen, Cypher oder einem Agentenplan startet.
Wie wird daraus Antworttext?
Das LLM formuliert aus Belegen, Pfaden, Tabellen oder Zwischenergebnissen eine nachvollziehbare Antwort.
Die Patterns unterscheiden sich vor allem im Startpunkt und darin, welche Schicht die größte Verantwortung trägt. Für Architekturentscheidungen ist das wichtiger als der Name des eingesetzten Tools.
| Pattern | Startpunkt | App | Vector Index | Neo4j/Cypher | LLM | Stärke | Risiko |
|---|---|---|---|---|---|---|---|
| Chunk-first | Ähnliche Textchunks | bettet die Frage ein und baut das Kontextpaket | primäres Startsignal | erweitert Treffer über Entitäten, Terms, Dokumente oder Nachbarn | antwortet aus Belegkontext | quellennahe Fragen in großen Korpora | ähnliche Chunks können fachlich am Ziel vorbeigehen |
| Entity-first | Entitäten oder Konzepte | normalisiert Begriffe und begrenzt Hops | hilft optional beim Entity Matching | liefert Nachbarschaften, Pfade und verbundene Quellen | erklärt Pfade und Belege | fachliche Abhängigkeiten bei brauchbarem Domänenmodell | schlechte Entity Resolution erzeugt falsche Pfade |
| Hybrid | mehrere Suchsignale | fusioniert, rerankt und beobachtet Signalbeiträge | liefert semantische Breite | liefert relationale Tiefe und Filter | nutzt gerankte Belege und Pfade | robuste produktionsnahe Kontextauswahl | Fusion wird ohne Evaluation zur Black Box |
| Text-to-Cypher | Graphschema und Frage | validiert Schema, Rechte und Query-Grenzen | meist Nebenrolle | führt strukturierte Cypher-Abfragen aus | plant oder erzeugt die Query und erklärt Ergebnisse | präzise strukturierte Fragen über Graphmuster | Query-Fehler, Schema-Missverständnisse und Halluzinationen |
| Agentic | Ziel, Lücke oder Arbeitsauftrag | setzt Tools, Budgets, Traces und Stop-Regeln | ein Werkzeug unter mehreren | ein Werkzeug für Pfade, Fakten und Nachbarschaften | orchestriert mehrere Schritte | komplexe Aufgaben mit iterativer Kontextsuche | Kosten, Kontrollverlust und schwer prüfbare Zwischenschritte |
Jedes Pattern ist ein anderer Weg durch dieselben Grundbausteine: App-Orchestrierung, Index, Graph, Query-Schicht und LLM.
Frage -> Frage-Embedding -> ähnliche Chunks -> Graphnachbarn, Entitäten, Terms oder Dokumente -> Belegkontext -> Antwort
Gut für: Quellenbezogene Fragen, große Textkorpora und einen pragmatischen Ausbau von klassischem RAG.
Achtung: Vector Search allein ist noch klassisches RAG. Zum GraphRAG-Pattern wird der Ablauf erst, wenn Treffer über Beziehungen erweitert, geprüft oder erklärt werden.
Verantwortung: Die App hält den Ablauf zusammen; der Vector Index findet Kandidaten; Neo4j liefert Nachbarschaft; das LLM formuliert.
Frage -> Entitäten oder Konzepte bestimmen -> 2 bis 3 Hops laufen -> relevante Pfade wählen -> Dokumente oder Chunks holen -> Antwort
Gut für: Domänen mit gepflegter Ontologie, stabilen Fachobjekten und Fragen nach Abhängigkeiten.
Achtung: Das Pattern steht und fällt mit Entity Resolution, Beziehungstypen und Hop-Grenzen. Mehr Pfade bedeuten nicht automatisch besseren Kontext.
Verantwortung: Die App normalisiert die Frage; Neo4j traversiert den Graph; der Vector Index ergänzt Quellen; das LLM erklärt die Verbindung.
Frage -> Chunks suchen + Entitäten suchen + Filter oder Cypher nutzen -> fusionieren und reranken -> Belege und Pfade -> Antwort
Gut für: Produktionsnahe Systeme, in denen kein einzelnes Signal zuverlässig genug ist.
Achtung: Hybrid braucht Ablation: Es muss sichtbar werden, ob Vektor, Keyword, Filter, Graph oder Reranking die Antwort wirklich verbessert.
Verantwortung: Die App bewertet Signale; Indizes liefern Kandidaten; Neo4j liefert Struktur; das LLM bleibt Antwortgenerator.
Frage -> LLM plant oder erzeugt Cypher -> Neo4j liefert strukturierte Ergebnisse -> LLM erklärt Ergebnis und Grenzen
Gut für: Fragen, die als klares Graphmuster beantwortbar sind: Wer ist verbunden mit was, über welche Beziehung, in welchem Zustand?
Achtung: Das LLM ist hier Query-Planer. Deshalb braucht es Schema-Kontext, erlaubte Query-Muster, Validierung und gute Fehlermeldungen.
Verantwortung: Die App begrenzt und validiert; das LLM plant; Neo4j führt aus; die Antwort muss Ergebnis und Query-Logik trennen.
Frage oder Ziel -> Agent plant Schritte -> nutzt Vector Search, Cypher und Tools -> prüft Lücken -> antwortet
Gut für: Mehrstufige Aufgaben, bei denen die richtige Suchstrategie erst während der Bearbeitung sichtbar wird.
Achtung: Agentisch heißt nicht automatisch besser. Ohne Traces, Budgets, Stop-Regeln und Tool-Grenzen wird Retrieval schwer kontrollierbar.
Verantwortung: Die App setzt Leitplanken; der Agent orchestriert; Werkzeuge liefern Daten; das LLM synthetisiert und begründet.
Die beste Entscheidung beginnt bei der Frageklasse. Erst danach lohnt sich die Diskussion über Graphschema, Index, Cypher oder Agenten.
Die Frage sucht konkrete Textbelege.
Chunk-first
Die Frage startet bei bekannten Fachobjekten.
Entity-first
Textnähe, Filter und Beziehungen müssen zusammenwirken.
Hybrid
Die Antwort ist ein präzises Graphmuster oder eine Liste.
Text-to-Cypher
Die Aufgabe braucht mehrere Such- und Prüfschritte.
Agentic
Neo4j kann Graph Store, Cypher-Schicht und Vector Index in einem System verbinden. Architekturentscheidend bleibt aber, ob eine Frage Textnähe, Entitäten, strukturierte Queries, kombinierte Signale oder agentische Planung braucht.
Nächste Schritte