Phase 2 · Praxis-Step 5 von 9
Aus Erwähnungen fachliche Entitäten, Beziehungskandidaten und einen kleinen Graphausschnitt für den Practice Brief ableiten.
Was du mitnimmst
Ein GraphRAG-Graph gewinnt Qualität durch fachliche Entitäten, stabile Beziehungstypen und klare Herkunftsbelege.

Praxisziel
Du erstellst ein kleines JSON-Artefakt mit Entitäten, Beziehungen und Herkunftsbelegen.
Szenario
Richtlinie A erwähnt kritische Kundensysteme und jährliche Prüfungen. Die Projektliste erwähnt CRM, Data Hub und Kundenportal. Jetzt muss entschieden werden, was nur Erwähnung ist und was als fachliche Entität oder Beziehung in den Graphen gehört.
Das ist die Stelle, an der aus gefundenen Namen ein fachliches Modell werden muss. Eine Extraktion kann beeindruckend viele Namen finden. Ein nützlicher Graph entsteht, wenn diese Namen zu klaren Entitäten, Beziehungstypen und Herkunftsbelegen verdichtet werden.
Im Mini-Use-Case reichen die Objekte, die unsere Frageklasse tragen: Richtlinie, System, Projekt, Team und Pflicht. Diese Begrenzung hält den Graphen lernbar.
Heuristik
Trenne Erwähnung, Entität, Beziehung und belegte Aussage. Eine Erwähnung ist Text. Eine Entität ist ein fachliches Objekt. Eine Beziehung ist eine modellierte Aussage zwischen Objekten. Eine belegte Aussage zeigt, warum diese Beziehung existiert.
Eine gute Beziehung hat Richtung, Typ und Herkunftsbeleg. "Richtlinie A definiert Prüfpflicht für kritische Kundensysteme" ist eine tragfähige Beziehung. "CRM ist als kritisch klassifiziert" ist eine zweite Beziehung. Erst gemeinsam entsteht der Pfad, den GraphRAG später nutzen kann.
Greifbar machen
Praxis-Hinweis: Praktisch entsteht diese Extraktion mit LLM-Extractors, Regeln, Parsern oder Graph-Construction-Bibliotheken. Der menschliche Anteil bleibt entscheidend: erlaubte Entitätstypen festlegen, Beziehungstypen begrenzen, Beispiele liefern und Stichproben prüfen. So bekommt das Tool einen fachlichen Rahmen.
Ein Graphfragment ist ein kleiner Ausschnitt des späteren Graphen. Es enthält nur die Entitäten und Beziehungen, die für eine Frageklasse gerade gebraucht werden. Im Mini-Use-Case ist das zum Beispiel der Ausschnitt aus Richtlinie, System und Projekt.
{
"entities": [
{ "entity_id": "policy-a", "type": "Policy", "label": "Richtlinie A" },
{ "entity_id": "system-crm", "type": "System", "label": "CRM" },
{ "entity_id": "project-alpha", "type": "Project", "label": "Projekt Alpha" }
],
"relations": [
{
"from": "policy-a",
"type": "defines_obligation_for",
"to": "system-crm",
"provenance_ref": "statement-policy-a-4-2-critical-systems"
},
{
"from": "system-crm",
"type": "used_by",
"to": "project-alpha",
"provenance_ref": "project-list"
}
]
}Schlüssel kurz erklärt
entities enthält fachliche Objekte, die als Knoten taugen.entity_id ist die stabile Kennung eines Objekts.type beschreibt die fachliche Klasse.relations enthält Kanten zwischen Objekten.from, to und type beschreiben Richtung und Bedeutung der Beziehung.provenance_ref verweist auf die belegte Aussage oder Quelle, die die Beziehung trägt.Achten auf
Worauf du achten musst
Jede Erwähnung wird zum Knoten. Der Graph wächst schnell, aber die fachliche Bedeutung bleibt schwach.
Ein zweiter Fehler ist Relation Wildwuchs. Wenn jede Kante anders heißt, entstehen zwar viele Beziehungen, aber kaum wiederverwendbare Pfade. Für den Start sind wenige stabile Beziehungstypen besser als viele kreative Labels.
Prüfen
Signal
Viele Knoten, wenige belastbare Beziehungstypen und kaum nutzbare Pfade.
Ein weiteres Signal: Fragen laufen weiter fast nur über Volltext, obwohl ein Graph existiert. Dann speichert der Graph vermutlich Erwähnungen und bildet noch wenig fachliches Modell ab.
Üben
Ergänze ein Team "Customer Core" und eine owned_by-Beziehung zwischen Projekt Alpha und Customer Core. Entscheide, welcher Herkunftsbeleg diese Beziehung tragen müsste.
Customer Core sollte eine eigene Team-Entität sein, wenn Projektliste, Systemkatalog oder Verantwortlichkeitsnotiz die Teamzuordnung führen.
project-alpha -> owned_by -> team-customer-core, also Projekt Alpha gehört zu Customer Core. Damit ist die Kette Richtlinie A → CRM → Projekt Alpha → Customer Core vollständig.
Die Aussage "Customer Core verantwortet Projekt Alpha" braucht einen Beleg aus Projektliste, Systemkatalog oder Verantwortlichkeitsnotiz. Die Leitfrage lautet: Welche Quelle trägt diese Beziehung?
Unterschiedliche Kanten können unterschiedliche Quellen, Autoritäten und Gültigkeiten haben. Genau dadurch bleibt der Graph erklärbar.
Reflektieren
Eine Erwähnung ist ein Textfund. Eine fachliche Entität ist ein stabilisiertes Objekt im Modell, zum Beispiel das System CRM oder Projekt Alpha.
Der Herkunftsbeleg zeigt, welche Quelle oder belegte Aussage eine Entität oder Beziehung trägt.
Eine verlässliche Beziehung braucht Startobjekt, Zielobjekt, Beziehungstyp, Quelle, Abschnitt, Autorität und möglichst Gültigkeit.
Kernaussage
Ein GraphRAG-Graph gewinnt Qualität durch fachliche Entitäten, stabile Beziehungstypen und klare Herkunftsbelege.