Property Graph
Neo4j modelliert Wissen als Knoten, Beziehungen und Eigenschaften. Das ist greifbar für Domänen-Graphen und hybride Dokument-/Fachmodelle.
Architektur-Detail · Enterprise
Die ausgefeilteste produktionsnahe GraphRAG-Architektur: Dokumente werden per LLMGraphTransformer in Neo4j extrahiert, Vector Index und Cypher-Traversal kombiniert, die Ergebnisse per LangChain oder LlamaIndex an den LLM übergeben. Aura Cloud für den Betrieb, GraphAcademy für das Team-Onboarding.
Kuratierte Architekturentscheidung auf Basis der lokalen Compass-Daten
Relevant wenn
Wenn GraphRAG produktiv deployed werden soll, Enterprise-Anforderungen (Monitoring, RBAC, Skalierung) bestehen und das Team bereit ist, in Graph-Kompetenz zu investieren.
Quellenlage
Produktnahes Neo4j-Muster aus offiziellen Neo4j-GraphRAG-, Vektorsuche- und Cypher-Bausteinen. Cypher ist die Neo4j-Abfragesprache für Graphmuster und Pfade.
Produktionsreifes GraphRAG für Enterprise: strukturiertes Domänenwissen, hybrides Retrieval, Nachvollziehbarkeit.
Systemkarte
Die Motion Map verdichtet das Muster auf seine wichtigsten Stationen: Eingabe, Daten- oder Graphschicht, Retrieval, Kontrolle und Antwort. Sie ist bewusst kleiner als die Referenzarchitektur darunter und soll zuerst die Leserichtung und die Systemgrenzen sichtbar machen.
Architekturblick
Diese Seite ist eine Entscheidungshilfe für den Stack. Der Blick liegt auf Datenfluss, Failure Modes, Evaluation, Tooling und dem nächsten sinnvollen Migrationsschritt.
Dokumente, Entitäten, Chunks und Quellen landen als Property Graph. Retrieval kombiniert semantische Suche mit Cypher-Traversals, Pfaden, Filtern und Quellenbelegen.
Vom kleinen GraphRAG-Pilot zu stabilen Entitätstypen, dann zu Domänenmodell, Rechtekonzept, Monitoring und kontrolliertem Agentenzugriff ausbauen.
Referenzarchitektur
Der Neo4j-Stack ist produktionsnäher als ein reines Referenzframework, weil Graphspeicherung, Abfragesprache, Vector Index und Integrationen zusammenkommen. Die Architektur wird dann stark, wenn semantische Suche über Cypher mit expliziten Beziehungen, Pfaden und Quellen verbunden wird.
01
Vor dem Import wird entschieden, welche Entitätstypen, Beziehungstypen und Eigenschaften fachlich zählen: Dokument, Chunk, Person, Organisation, Vertrag, System oder Risiko.
02
Dokumente, Tabellen, APIs oder Events werden geladen, bereinigt, gechunked und mit Provenance versehen.
03
Entitäten, Beziehungen, Chunks und Quellen werden in Neo4j gespeichert. Je nach Ansatz entsteht ein Dokument-Graph, ein Domänen-Graph oder eine Kombination.
04
Embeddings werden auf Chunks, Dokumenten oder Entitäten gespeichert, damit semantische Suche und explizite Graphbeziehungen zusammenarbeiten.
05
Eine Frage startet oft mit Vector Search oder Entity Lookup. Danach erweitert Cypher den Kontext über Nachbarschaften, Pfade, Filter und Regeln.
06
Das LLM bekommt Textstellen, Entitäten, Beziehungen und Quellen. Gute Antworten zeigen, welche Graphpfade und Dokumentstellen sie tragen.
Implementierungs-, Integrations- und Betriebsaufwand.
Qualität, Struktur und Zugänglichkeit der Daten vor dem Pilot.
Erfahrung mit RAG, Graphdenken, Infrastruktur und Evaluation.
Das Team noch kein Graph-Schema verantworten kann.
Höchste Komplexität unter den produktionsnahen Ansätzen. Graph-Schema-Design ist kritisch und zeitintensiv — Fehler im Ontologie-Design sind schwer rückgängig zu machen. Neo4j-Expertise im Team erforderlich.
Bausteine
Neo4j ist Speicherort für Beziehungen. Der Architekturwert entsteht daraus, dass Graphmodell, Cypher, Vektorsuche und GenAI-Integrationen in einer kontrollierbaren Plattform zusammenarbeiten.
Neo4j modelliert Wissen als Knoten, Beziehungen und Eigenschaften. Das ist greifbar für Domänen-Graphen und hybride Dokument-/Fachmodelle.
Cypher macht Pfade, Muster, Nachbarschaften und Traversals explizit abfragbar. Das ist der große Unterschied zu reinem Vector Retrieval.
Semantische Suche kann direkt im Neo4j-Stack mit Graphabfragen kombiniert werden, statt Vector Store und Graph getrennt zu orchestrieren.
LangChain, LlamaIndex, Neo4j GraphRAG Libraries und Knowledge-Graph-Builder helfen beim Aufbau und bei der Integration in RAG-Anwendungen.
Qualitätshebel
Neo4j gibt dir mächtige Graphwerkzeuge, aber keinen fertigen Fachgraphen. Die Qualität entsteht in Modellierung, Entity Resolution, Messung und Betrieb.
Ein produktiver Graph braucht Struktur, aber zu frühe Modellhärte blockiert Lernen. Starte mit wenigen stabilen Typen und erweitere anhand echter Fragen.
Neo4j speichert Beziehungen zuverlässig, aber es entscheidet nicht automatisch, ob zwei Namen dieselbe Entität meinen. Diese Qualität muss aktiv gebaut werden.
Prüfe, welche Antworten durch Vector Search entstehen und welche wirklich von Cypher, Pfaden oder Beziehungen profitieren.
Produktionsnah heißt Rollen, Backups, Monitoring, Kosten, Datenaktualisierung, Indexpflege und Query-Performance. Das ist Architektur, nicht Nacharbeit.
Ausbaustufen
Der sinnvolle Weg ist iterativ: Erst kleine GraphRAG-Fragen beweisen, dann Beziehungen und Domänenmodell stabilisieren, erst danach Betrieb, Governance und Agentenzugriff ausbauen.
Stufe 1
Kleiner Graph, wenige Entitätstypen, Vector Index und 20 echte Testfragen.
Stufe 2
Vector Search wird mit Cypher-Traversals, Metadatenfiltern und Quellenpfaden kombiniert.
Stufe 3
Fachliche Objekte, Regeln, Rollen und Datenquellen werden als langlebiges Wissensmodell gepflegt.
Stufe 4
Governance, Monitoring, Kostenkontrolle, RBAC, Evaluation, CI für Graph-Änderungen und Agenten-Zugriff ergänzen.
In welchem Kontext das Muster typischerweise Sinn ergibt und welchen Beitrag es dort leistet.
Produkte, Kunden, Verträge, Tickets und Systeme sollen in einer produktiven Graphdatenbank zusammenlaufen.
Neo4j liefert Graphspeicher, Abfrage, Vektorindex und Integrationen in einem Stack.
Antworten müssen mit Entitäten, Relationen und Quellen begründet werden.
Cypher-Pfade machen Retrieval-Entscheidungen nachvollziehbarer.
Eine Frage betrifft Kunde, Vertrag, Ansprechpartner, Risiko und zugehörige Dokumente. Diese Objekte existieren als Knoten und Beziehungen in Neo4j.
Neo4j GraphRAG kann erst relevante Entitäten finden, dann über Beziehungen navigieren und anschließend passende Textstellen für die Antwort laden.
Domänenmodell skizzieren
Betriebsanforderungen priorisieren
Neo4j-Pilot mit messbarer Retrieval-Baseline planen