Architektur-Detail · Enterprise

Neo4j GraphRAG Stack

Die ausgefeilteste produktionsnahe GraphRAG-Architektur: Dokumente werden per LLMGraphTransformer in Neo4j extrahiert, Vector Index und Cypher-Traversal kombiniert, die Ergebnisse per LangChain oder LlamaIndex an den LLM übergeben. Aura Cloud für den Betrieb, GraphAcademy für das Team-Onboarding.

Fortgeschritten

Aufwand: hoch

Datenreife: hoch

Team-Reife: hoch

Kuratierte Architekturentscheidung auf Basis der lokalen Compass-Daten

Relevant wenn

Wenn GraphRAG produktiv deployed werden soll, Enterprise-Anforderungen (Monitoring, RBAC, Skalierung) bestehen und das Team bereit ist, in Graph-Kompetenz zu investieren.

Quellenlage

Produktnahes Neo4j-Muster aus offiziellen Neo4j-GraphRAG-, Vektorsuche- und Cypher-Bausteinen. Cypher ist die Neo4j-Abfragesprache für Graphmuster und Pfade.

Welches Problem löst das Muster?

Produktionsreifes GraphRAG für Enterprise: strukturiertes Domänenwissen, hybrides Retrieval, Nachvollziehbarkeit.

Systemkarte

Wie der Architekturfluss aussieht

Die Motion Map verdichtet das Muster auf seine wichtigsten Stationen: Eingabe, Daten- oder Graphschicht, Retrieval, Kontrolle und Antwort. Sie ist bewusst kleiner als die Referenzarchitektur darunter und soll zuerst die Leserichtung und die Systemgrenzen sichtbar machen.

Architekturblick

Was du bauen, betreiben und messen musst

Diese Seite ist eine Entscheidungshilfe für den Stack. Der Blick liegt auf Datenfluss, Failure Modes, Evaluation, Tooling und dem nächsten sinnvollen Migrationsschritt.

Stack-Schnitt

Neo4jCypherVector IndexGraph ConstructionEntity ResolutionGraphRAG LibraryRBACMonitoring

Runtime-Datenfluss

Dokumente, Entitäten, Chunks und Quellen landen als Property Graph. Retrieval kombiniert semantische Suche mit Cypher-Traversals, Pfaden, Filtern und Quellenbelegen.

Migrationspfad

Vom kleinen GraphRAG-Pilot zu stabilen Entitätstypen, dann zu Domänenmodell, Rechtekonzept, Monitoring und kontrolliertem Agentenzugriff ausbauen.

Failure Modes

Das Graphmodell wächst schneller als die fachliche Governance.
Entity Resolution erzeugt falsche Knoten oder Dubletten.
Cypher-Abfragen werden zu breit und teuer.

Evaluation

Vector- und Graphbeitrag getrennt messen.
Pfadqualität und Quellenbelege prüfen.
Query-Latenz und Indexpflege als Betriebsmetriken aufnehmen.

Tooling & Betrieb

Neo4j Aura
Cypher
Neo4j Vector Index
LangChain oder LlamaIndex
Graph Data Science
GraphAcademy

Referenzarchitektur

Wie ein Neo4j GraphRAG Stack arbeitet

Der Neo4j-Stack ist produktionsnäher als ein reines Referenzframework, weil Graphspeicherung, Abfragesprache, Vector Index und Integrationen zusammenkommen. Die Architektur wird dann stark, wenn semantische Suche über Cypher mit expliziten Beziehungen, Pfaden und Quellen verbunden wird.

01
Domäne modellieren
Vor dem Import wird entschieden, welche Entitätstypen, Beziehungstypen und Eigenschaften fachlich zählen: Dokument, Chunk, Person, Organisation, Vertrag, System oder Risiko.
02
Quellen ingestieren
Dokumente, Tabellen, APIs oder Events werden geladen, bereinigt, gechunked und mit Provenance versehen.
03
Graph aufbauen
Entitäten, Beziehungen, Chunks und Quellen werden in Neo4j gespeichert. Je nach Ansatz entsteht ein Dokument-Graph, ein Domänen-Graph oder eine Kombination.
04
Vector Index ergänzen
Embeddings werden auf Chunks, Dokumenten oder Entitäten gespeichert, damit semantische Suche und explizite Graphbeziehungen zusammenarbeiten.
05
Cypher-Kontext holen
Eine Frage startet oft mit Vector Search oder Entity Lookup. Danach erweitert Cypher den Kontext über Nachbarschaften, Pfade, Filter und Regeln.
06
Antwort mit Pfaden liefern
Das LLM bekommt Textstellen, Entitäten, Beziehungen und Quellen. Gute Antworten zeigen, welche Graphpfade und Dokumentstellen sie tragen.

Aufwand: hoch
Datenreife: hoch
Team-Reife: hoch

Nicht ideal wenn

Das Team noch kein Graph-Schema verantworten kann.

Trade-offs

Höchste Komplexität unter den produktionsnahen Ansätzen. Graph-Schema-Design ist kritisch und zeitintensiv — Fehler im Ontologie-Design sind schwer rückgängig zu machen. Neo4j-Expertise im Team erforderlich.

Bausteine

Welche Neo4j-Bausteine zusammenspielen

Neo4j ist Speicherort für Beziehungen. Der Architekturwert entsteht daraus, dass Graphmodell, Cypher, Vektorsuche und GenAI-Integrationen in einer kontrollierbaren Plattform zusammenarbeiten.

Property Graph

Neo4j modelliert Wissen als Knoten, Beziehungen und Eigenschaften. Das ist greifbar für Domänen-Graphen und hybride Dokument-/Fachmodelle.

Cypher

Cypher macht Pfade, Muster, Nachbarschaften und Traversals explizit abfragbar. Das ist der große Unterschied zu reinem Vector Retrieval.

Vector Index

Semantische Suche kann direkt im Neo4j-Stack mit Graphabfragen kombiniert werden, statt Vector Store und Graph getrennt zu orchestrieren.

GenAI-Integrationen

LangChain, LlamaIndex, Neo4j GraphRAG Libraries und Knowledge-Graph-Builder helfen beim Aufbau und bei der Integration in RAG-Anwendungen.

Qualitätshebel

Wo Neo4j GraphRAG anspruchsvoll wird

Neo4j gibt dir mächtige Graphwerkzeuge, aber keinen fertigen Fachgraphen. Die Qualität entsteht in Modellierung, Entity Resolution, Messung und Betrieb.

Schema nicht zu früh einfrieren

Ein produktiver Graph braucht Struktur, aber zu frühe Modellhärte blockiert Lernen. Starte mit wenigen stabilen Typen und erweitere anhand echter Fragen.

Entity Resolution ernst nehmen

Neo4j speichert Beziehungen zuverlässig, aber es entscheidet nicht automatisch, ob zwei Namen dieselbe Entität meinen. Diese Qualität muss aktiv gebaut werden.

Graph und Vector getrennt messen

Prüfe, welche Antworten durch Vector Search entstehen und welche wirklich von Cypher, Pfaden oder Beziehungen profitieren.

Betrieb früh mitdenken

Produktionsnah heißt Rollen, Backups, Monitoring, Kosten, Datenaktualisierung, Indexpflege und Query-Performance. Das ist Architektur, nicht Nacharbeit.

Stack-Komponenten

Neo4j AuraLLMGraphTransformerLangChain / LlamaIndexVector IndexCypher

Ausbaustufen

Vom Neo4j-Pilot zum Enterprise-GraphRAG

Der sinnvolle Weg ist iterativ: Erst kleine GraphRAG-Fragen beweisen, dann Beziehungen und Domänenmodell stabilisieren, erst danach Betrieb, Governance und Agentenzugriff ausbauen.

Stufe 1
Kleiner Graph, wenige Entitätstypen, Vector Index und 20 echte Testfragen.
Stufe 2
Vector Search wird mit Cypher-Traversals, Metadatenfiltern und Quellenpfaden kombiniert.
Stufe 3
Fachliche Objekte, Regeln, Rollen und Datenquellen werden als langlebiges Wissensmodell gepflegt.
Stufe 4
Governance, Monitoring, Kostenkontrolle, RBAC, Evaluation, CI für Graph-Änderungen und Agenten-Zugriff ergänzen.

Konkrete Beispiele

In welchem Kontext das Muster typischerweise Sinn ergibt und welchen Beitrag es dort leistet.

Enterprise-Wissensgraph

Produkte, Kunden, Verträge, Tickets und Systeme sollen in einer produktiven Graphdatenbank zusammenlaufen.

Neo4j liefert Graphspeicher, Abfrage, Vektorindex und Integrationen in einem Stack.

Auditierbare Antwortpfade

Antworten müssen mit Entitäten, Relationen und Quellen begründet werden.

Cypher-Pfade machen Retrieval-Entscheidungen nachvollziehbarer.

Einsteigerbeispiel: Vertrags- und Kundenkontext

Eine Frage betrifft Kunde, Vertrag, Ansprechpartner, Risiko und zugehörige Dokumente. Diese Objekte existieren als Knoten und Beziehungen in Neo4j.

Neo4j GraphRAG kann erst relevante Entitäten finden, dann über Beziehungen navigieren und anschließend passende Textstellen für die Antwort laden.

Nächste Umsetzungsschritte

1
Domänenmodell skizzieren
2
Betriebsanforderungen priorisieren
3
Neo4j-Pilot mit messbarer Retrieval-Baseline planen

Quellen und Ressourcen

Neo4j GraphRAG for Python neo4j-graphrag-python

Neo4j GraphRAG Stack

Fortgeschritten

Aufwand: hoch

Datenreife: hoch

Team-Reife: hoch

Kuratierte Architekturentscheidung auf Basis der lokalen Compass-Daten

Konkrete Beispiele

In welchem Kontext das Muster typischerweise Sinn ergibt und welchen Beitrag es dort leistet.

Enterprise-Wissensgraph

Produkte, Kunden, Verträge, Tickets und Systeme sollen in einer produktiven Graphdatenbank zusammenlaufen.

Neo4j liefert Graphspeicher, Abfrage, Vektorindex und Integrationen in einem Stack.

Auditierbare Antwortpfade

Antworten müssen mit Entitäten, Relationen und Quellen begründet werden.

Cypher-Pfade machen Retrieval-Entscheidungen nachvollziehbarer.

Einsteigerbeispiel: Vertrags- und Kundenkontext

Eine Frage betrifft Kunde, Vertrag, Ansprechpartner, Risiko und zugehörige Dokumente. Diese Objekte existieren als Knoten und Beziehungen in Neo4j.

Neo4j GraphRAG kann erst relevante Entitäten finden, dann über Beziehungen navigieren und anschließend passende Textstellen für die Antwort laden.

Neo4j GraphRAG Stack

Welches Problem löst das Muster?

Wie der Architekturfluss aussieht

Was du bauen, betreiben und messen musst

Stack-Schnitt

Runtime-Datenfluss

Migrationspfad

Failure Modes

Evaluation

Tooling & Betrieb

Wie ein Neo4j GraphRAG Stack arbeitet

Domäne modellieren

Quellen ingestieren

Graph aufbauen

Vector Index ergänzen

Cypher-Kontext holen

Antwort mit Pfaden liefern

Nicht ideal wenn

Trade-offs

Welche Neo4j-Bausteine zusammenspielen

Property Graph

Cypher

Vector Index

GenAI-Integrationen

Wo Neo4j GraphRAG anspruchsvoll wird

Schema nicht zu früh einfrieren

Entity Resolution ernst nehmen

Graph und Vector getrennt messen

Betrieb früh mitdenken

Stack-Komponenten

Vom Neo4j-Pilot zum Enterprise-GraphRAG

Pilot mit Aura oder lokal

Hybrid Retrieval

Domänen-Graph

Enterprise-Betrieb

Konkrete Beispiele

Enterprise-Wissensgraph

Auditierbare Antwortpfade

Einsteigerbeispiel: Vertrags- und Kundenkontext

Nächste Umsetzungsschritte

Verwandte Konzepte, Tools und Plattformen

Quellen und Ressourcen

Neo4j GraphRAG Stack

Welches Problem löst das Muster?

Wie der Architekturfluss aussieht

Was du bauen, betreiben und messen musst

Stack-Schnitt

Runtime-Datenfluss

Migrationspfad

Failure Modes

Evaluation

Tooling & Betrieb

Wie ein Neo4j GraphRAG Stack arbeitet

Domäne modellieren

Quellen ingestieren

Graph aufbauen

Vector Index ergänzen

Cypher-Kontext holen

Antwort mit Pfaden liefern

Nicht ideal wenn

Trade-offs

Welche Neo4j-Bausteine zusammenspielen

Property Graph

Cypher

Vector Index

GenAI-Integrationen

Wo Neo4j GraphRAG anspruchsvoll wird

Schema nicht zu früh einfrieren

Entity Resolution ernst nehmen

Graph und Vector getrennt messen

Betrieb früh mitdenken

Stack-Komponenten

Vom Neo4j-Pilot zum Enterprise-GraphRAG

Pilot mit Aura oder lokal

Hybrid Retrieval

Domänen-Graph

Enterprise-Betrieb

Konkrete Beispiele

Enterprise-Wissensgraph

Auditierbare Antwortpfade