Phase 2 · Praxis-Step 5 von 9

Entitäten und Beziehungen fachlich klären

Aus Erwähnungen fachliche Entitäten, Beziehungskandidaten und einen kleinen Graphausschnitt für den Practice Brief ableiten.

Was du mitnimmst

Ein GraphRAG-Graph gewinnt Qualität durch fachliche Entitäten, stabile Beziehungstypen und klare Herkunftsbelege.

Entitäten und Beziehungen fachlich klären: Ein GraphRAG-Graph gewinnt Qualität durch fachliche Entitäten, stabile Beziehungstypen und klare Herkunftsbelege.

Praxisziel

Was du praktisch entscheidest

Du erstellst ein kleines JSON-Artefakt mit Entitäten, Beziehungen und Herkunftsbelegen.

Szenario

Ausgangslage im Mini-Use-Case

Richtlinie A erwähnt kritische Kundensysteme und jährliche Prüfungen. Die Projektliste erwähnt CRM, Data Hub und Kundenportal. Jetzt muss entschieden werden, was nur Erwähnung ist und was als fachliche Entität oder Beziehung in den Graphen gehört.

Das ist die Stelle, an der aus gefundenen Namen ein fachliches Modell werden muss. Eine Extraktion kann beeindruckend viele Namen finden. Ein nützlicher Graph entsteht, wenn diese Namen zu klaren Entitäten, Beziehungstypen und Herkunftsbelegen verdichtet werden.

Im Mini-Use-Case reichen die Objekte, die unsere Frageklasse tragen: Richtlinie, System, Projekt, Team und Pflicht. Diese Begrenzung hält den Graphen lernbar.

Heuristik

Arbeitsprinzip

Trenne Erwähnung, Entität, Beziehung und belegte Aussage. Eine Erwähnung ist Text. Eine Entität ist ein fachliches Objekt. Eine Beziehung ist eine modellierte Aussage zwischen Objekten. Eine belegte Aussage zeigt, warum diese Beziehung existiert.

Eine gute Beziehung hat Richtung, Typ und Herkunftsbeleg. "Richtlinie A definiert Prüfpflicht für kritische Kundensysteme" ist eine tragfähige Beziehung. "CRM ist als kritisch klassifiziert" ist eine zweite Beziehung. Erst gemeinsam entsteht der Pfad, den GraphRAG später nutzen kann.

Greifbar machen

Praxisartefakt

Praxis-Hinweis: Praktisch entsteht diese Extraktion mit LLM-Extractors, Regeln, Parsern oder Graph-Construction-Bibliotheken. Der menschliche Anteil bleibt entscheidend: erlaubte Entitätstypen festlegen, Beziehungstypen begrenzen, Beispiele liefern und Stichproben prüfen. So bekommt das Tool einen fachlichen Rahmen.

Ein Graphfragment ist ein kleiner Ausschnitt des späteren Graphen. Es enthält nur die Entitäten und Beziehungen, die für eine Frageklasse gerade gebraucht werden. Im Mini-Use-Case ist das zum Beispiel der Ausschnitt aus Richtlinie, System und Projekt.

graph-fragment.jsonjson

{
  "entities": [
    { "entity_id": "policy-a", "type": "Policy", "label": "Richtlinie A" },
    { "entity_id": "system-crm", "type": "System", "label": "CRM" },
    { "entity_id": "project-alpha", "type": "Project", "label": "Projekt Alpha" }
  ],
  "relations": [
    {
      "from": "policy-a",
      "type": "defines_obligation_for",
      "to": "system-crm",
      "provenance_ref": "statement-policy-a-4-2-critical-systems"
    },
    {
      "from": "system-crm",
      "type": "used_by",
      "to": "project-alpha",
      "provenance_ref": "project-list"
    }
  ]
}

Schlüssel kurz erklärt

entities enthält fachliche Objekte, die als Knoten taugen.
entity_id ist die stabile Kennung eines Objekts.
type beschreibt die fachliche Klasse.
relations enthält Kanten zwischen Objekten.
from, to und type beschreiben Richtung und Bedeutung der Beziehung.
provenance_ref verweist auf die belegte Aussage oder Quelle, die die Beziehung trägt.

Achten auf

Typischer Qualitätsfehler

Worauf du achten musst

Jede Erwähnung wird zum Knoten. Der Graph wächst schnell, aber die fachliche Bedeutung bleibt schwach.

Ein zweiter Fehler ist Relation Wildwuchs. Wenn jede Kante anders heißt, entstehen zwar viele Beziehungen, aber kaum wiederverwendbare Pfade. Für den Start sind wenige stabile Beziehungstypen besser als viele kreative Labels.

Prüfen

Woran du es erkennst

Signal

Viele Knoten, wenige belastbare Beziehungstypen und kaum nutzbare Pfade.

Ein weiteres Signal: Fragen laufen weiter fast nur über Volltext, obwohl ein Graph existiert. Dann speichert der Graph vermutlich Erwähnungen und bildet noch wenig fachliches Modell ab.

Üben

Mini-Aufgabe

Ergänze ein Team "Customer Core" und eine owned_by-Beziehung zwischen Projekt Alpha und Customer Core. Entscheide, welcher Herkunftsbeleg diese Beziehung tragen müsste.

Musterlösung

Entität

Customer Core sollte eine eigene Team-Entität sein, wenn Projektliste, Systemkatalog oder Verantwortlichkeitsnotiz die Teamzuordnung führen.

Beziehung

project-alpha -> owned_by -> team-customer-core, also Projekt Alpha gehört zu Customer Core. Damit ist die Kette Richtlinie A → CRM → Projekt Alpha → Customer Core vollständig.

Herkunftsbeleg

Die Aussage "Customer Core verantwortet Projekt Alpha" braucht einen Beleg aus Projektliste, Systemkatalog oder Verantwortlichkeitsnotiz. Die Leitfrage lautet: Welche Quelle trägt diese Beziehung?

Warum wichtig

Unterschiedliche Kanten können unterschiedliche Quellen, Autoritäten und Gültigkeiten haben. Genau dadurch bleibt der Graph erklärbar.

Reflektieren

Selbsttest

1.Was ist der Unterschied zwischen einer Erwähnung und einer fachlichen Entität?

Eine Erwähnung ist ein Textfund. Eine fachliche Entität ist ein stabilisiertes Objekt im Modell, zum Beispiel das System CRM oder Projekt Alpha.

2.Warum ist der Herkunftsbeleg im Extraktions-Artefakt wichtig?

Der Herkunftsbeleg zeigt, welche Quelle oder belegte Aussage eine Entität oder Beziehung trägt.

3.Welche Informationen braucht eine verlässliche Beziehung?

Eine verlässliche Beziehung braucht Startobjekt, Zielobjekt, Beziehungstyp, Quelle, Abschnitt, Autorität und möglichst Gültigkeit.

Kernaussage

Ein GraphRAG-Graph gewinnt Qualität durch fachliche Entitäten, stabile Beziehungstypen und klare Herkunftsbelege.

Vorheriger Step Nächster Step

Phase 2 · Praxis-Step 5 von 9

Entitäten und Beziehungen fachlich klären

Aus Erwähnungen fachliche Entitäten, Beziehungskandidaten und einen kleinen Graphausschnitt für den Practice Brief ableiten.

Was du mitnimmst

Ein GraphRAG-Graph gewinnt Qualität durch fachliche Entitäten, stabile Beziehungstypen und klare Herkunftsbelege.

Praxisziel

Was du praktisch entscheidest

Du erstellst ein kleines JSON-Artefakt mit Entitäten, Beziehungen und Herkunftsbelegen.

Szenario

Ausgangslage im Mini-Use-Case

Im Mini-Use-Case reichen die Objekte, die unsere Frageklasse tragen: Richtlinie, System, Projekt, Team und Pflicht. Diese Begrenzung hält den Graphen lernbar.

Heuristik

Arbeitsprinzip

Greifbar machen

Praxisartefakt

graph-fragment.jsonjson

{
  "entities": [
    { "entity_id": "policy-a", "type": "Policy", "label": "Richtlinie A" },
    { "entity_id": "system-crm", "type": "System", "label": "CRM" },
    { "entity_id": "project-alpha", "type": "Project", "label": "Projekt Alpha" }
  ],
  "relations": [
    {
      "from": "policy-a",
      "type": "defines_obligation_for",
      "to": "system-crm",
      "provenance_ref": "statement-policy-a-4-2-critical-systems"
    },
    {
      "from": "system-crm",
      "type": "used_by",
      "to": "project-alpha",
      "provenance_ref": "project-list"
    }
  ]
}

Schlüssel kurz erklärt

entities enthält fachliche Objekte, die als Knoten taugen.
entity_id ist die stabile Kennung eines Objekts.
type beschreibt die fachliche Klasse.
relations enthält Kanten zwischen Objekten.
from, to und type beschreiben Richtung und Bedeutung der Beziehung.
provenance_ref verweist auf die belegte Aussage oder Quelle, die die Beziehung trägt.

Achten auf

Typischer Qualitätsfehler

Worauf du achten musst

Jede Erwähnung wird zum Knoten. Der Graph wächst schnell, aber die fachliche Bedeutung bleibt schwach.

Prüfen

Woran du es erkennst

Signal

Viele Knoten, wenige belastbare Beziehungstypen und kaum nutzbare Pfade.

Ein weiteres Signal: Fragen laufen weiter fast nur über Volltext, obwohl ein Graph existiert. Dann speichert der Graph vermutlich Erwähnungen und bildet noch wenig fachliches Modell ab.

Üben

Mini-Aufgabe

Ergänze ein Team "Customer Core" und eine owned_by-Beziehung zwischen Projekt Alpha und Customer Core. Entscheide, welcher Herkunftsbeleg diese Beziehung tragen müsste.

Musterlösung

Entität

Customer Core sollte eine eigene Team-Entität sein, wenn Projektliste, Systemkatalog oder Verantwortlichkeitsnotiz die Teamzuordnung führen.

Beziehung

project-alpha -> owned_by -> team-customer-core, also Projekt Alpha gehört zu Customer Core. Damit ist die Kette Richtlinie A → CRM → Projekt Alpha → Customer Core vollständig.

Herkunftsbeleg

Die Aussage "Customer Core verantwortet Projekt Alpha" braucht einen Beleg aus Projektliste, Systemkatalog oder Verantwortlichkeitsnotiz. Die Leitfrage lautet: Welche Quelle trägt diese Beziehung?

Warum wichtig

Unterschiedliche Kanten können unterschiedliche Quellen, Autoritäten und Gültigkeiten haben. Genau dadurch bleibt der Graph erklärbar.

Reflektieren

Selbsttest

1.Was ist der Unterschied zwischen einer Erwähnung und einer fachlichen Entität?

Eine Erwähnung ist ein Textfund. Eine fachliche Entität ist ein stabilisiertes Objekt im Modell, zum Beispiel das System CRM oder Projekt Alpha.

2.Warum ist der Herkunftsbeleg im Extraktions-Artefakt wichtig?

Der Herkunftsbeleg zeigt, welche Quelle oder belegte Aussage eine Entität oder Beziehung trägt.

3.Welche Informationen braucht eine verlässliche Beziehung?

Eine verlässliche Beziehung braucht Startobjekt, Zielobjekt, Beziehungstyp, Quelle, Abschnitt, Autorität und möglichst Gültigkeit.

Kernaussage

Ein GraphRAG-Graph gewinnt Qualität durch fachliche Entitäten, stabile Beziehungstypen und klare Herkunftsbelege.

Vorheriger Step Nächster Step