Zum Inhalt springen
GraphRAG Compass
  • Grundlagen
  • Architekturen
  • Praxis
  • Business Cases
  • Lernpfad
  • Simulation
  • Landkarte
GraphRAG Compass

Öffentlicher Field Guide für GraphRAG, Knowledge Graphs, AI-Architekturen und bessere Entscheidungen in komplexen Wissenssystemen.

Erkunden

  • Grundlagen
  • Architekturen
  • Praxis
  • Business Cases
  • Simulation
  • Landkarte

Lernen

  • Lernpfad
  • Mini-Use-Case
  • GraphRAG Poster
  • Glossar

Über

  • About
  • LinkedIn

Discovery

  • llms.txt
  • llms-full.txt
  • sitemap.xml

Rechtliches

  • Impressum
  • Datenschutz

© 2026 Meierhoff Systems · GraphRAG Compass

Orientierung für Entscheidungen in Wissenssystemen

Alle Phasen
Phase 2 von 4 · Klären: Practice Brief & Anforderungen
01Einen Praxisfall eingrenzen02Quellen inventarisieren03Anforderungen an Chunks klären04Aussagen mit Herkunft modellieren05Entitäten und Beziehungen fachlich klären06Identität und Zeit stabilisieren07Antwortweg fachlich vergleichen08Evaluieren und Fehler lokalisieren09Phase-2-Checkpoint

Phase 2 · Praxis-Step 2 von 9

Quellen inventarisieren

Quellen als Qualitätsobjekte mit Typ, Besitzer, Aktualität, Berechtigung, Autorität und Risiko behandeln.

Was du mitnimmst

Retrieval-Qualität beginnt mit Quellenqualität.

Quellen inventarisieren: Retrieval-Qualität beginnt mit Quellenqualität.

Praxisziel

Was du praktisch entscheidest

Du erstellst ein Quelleninventar mit Typ, Besitzer, Aktualität, Berechtigung, Autorität und Risiko. Damit weißt du vor dem Retrieval, welche Quellen verlässlich tragen und welche Quellen nur vorsichtig genutzt werden sollten.

Szenario

Ausgangslage im Mini-Use-Case

Im Mini-Use-Case liegen vier Quellen vor: eine Richtlinie als PDF, eine Projektliste als Tabelle, ein Systemkatalog als Wiki-Seite und eine Verantwortlichkeitsnotiz. Alle vier klingen relevant. Jede Quelle hat eine eigene Autorität, Aktualität und Struktur.

Die Richtlinie ist wahrscheinlich maßgeblich für Pflichten. Die Projektliste ist wahrscheinlich gut für Zuordnungen. Der Systemkatalog ist gut für technische Stammdaten. Die Verantwortlichkeitsnotiz kann aktuelle Hinweise liefern und braucht eine formale Einordnung. Diese Unterschiede müssen sichtbar werden, bevor Retrieval oder Graphaufbau starten.

In echten Projekten wird diese Arbeit oft übersprungen. Dann landet alles im selben Index und das System behandelt jedes Fragment so, als hätte es denselben Beweiswert. Genau dadurch entstehen Antworten, die formal "eine Quelle" haben, aber fachlich schwach sind.

Heuristik

Arbeitsprinzip

QUELLENINVENTARPolicy v3.1aktuellReport 2022veraltetInterne Mailkeine Auth.

Behandle Quellen als bewertete Objekte. Jede Quelle braucht eine Rolle: Belegt sie Regeln, liefert sie Stammdaten, beschreibt sie aktuelle Zuständigkeiten oder erzeugt sie nur Kontext?

Eine Quelle kann je nach Frage eine andere Rolle haben. Eine Tabelle trägt Projekt-System-Zuordnungen. Eine Richtlinie trägt Prüfpflichten. Ein Systemkatalog trägt aktuelle Systemverantwortung, wenn er dafür gepflegt wird. Das Inventar macht diese Quellenrollen früh sichtbar.

Drei Felder sind dabei besonders wichtig:

FeldEinfache Bedeutung
BerechtigungWer darf diese Quelle oder Teile daraus sehen?
AutoritätWie verbindlich ist die Quelle für die konkrete Frage?
RisikoWas kann bei dieser Quelle schiefgehen: veraltet, widersprüchlich, schwer lesbar, unvollständig oder nur eingeschränkt nutzbar?

Greifbar machen

Praxisartefakt

Das Quelleninventar ist ein kompaktes JSON-Artefakt. Es zeigt die vorhandenen Quellen und ihre Rolle für die Frageklasse.

Praxis-Hinweis: In der Umsetzung liegt dieses Inventar oft als Tabelle, Datenkatalog oder Confluence-Seite vor. Wichtig ist, dass Besitzer, Aktualität, Berechtigung, Autorität und Risiko vor der technischen Verarbeitung gepflegt werden. Später werden genau diese Felder als Metadaten, Filter und Prioritätsregeln in Retrieval, Graphaufbau und Antwortprüfung genutzt.

source-inventory.jsonjson
{
  "sources": [
    {
      "source_id": "policy-a",
      "title": "Richtlinie A",
      "type": "pdf",
      "owner": "Compliance",
      "updated_at": "2026-04",
      "permission_scope": "internal",
      "authority_for": ["Prüfpflichten", "Regelbelege", "Gültigkeit"],
      "risk": "Tabellen und Fußnoten können beim Parsing verloren gehen"
    },
    {
      "source_id": "project-list",
      "title": "Projektliste",
      "type": "table",
      "owner": "PMO",
      "updated_at": "monatlich",
      "permission_scope": "internal",
      "authority_for": ["Projekt-System-Zuordnung"],
      "risk": "Systemnamen sind uneinheitlich"
    }
  ],
  "priority_rule": "Offizielle Richtlinien tragen Pflichten. Projektlisten tragen Projektzuordnungen."
}

Schlüssel kurz erklärt

  • source_id ist die stabile technische Kennung der Quelle.
  • type beschreibt den Quellentyp.
  • owner benennt die verantwortliche Stelle.
  • updated_at zeigt den Stand.
  • permission_scope steuert Sichtbarkeit.
  • authority_for sagt, für welche Aussagen die Quelle tragfähig ist.
  • risk hält fest, was bei dieser Quelle schiefgehen kann.

Achten auf

Typischer Qualitätsfehler

Worauf du achten musst

Alle Quellen werden gleich behandelt. Später überschreibt dann eine veraltete Tabelle eine aktuelle Richtlinie oder eine Notiz wirkt genauso belastbar wie ein offizielles Dokument.

Ein weiterer typischer Fehler ist die fehlende Besitzfrage. Wenn niemand für eine Quelle verantwortlich ist, kann auch niemand klären, ob sie aktuell, vollständig oder fachlich verbindlich ist. Für GraphRAG ist Ownership Teil der Vertrauensbasis.

Prüfen

Woran du es erkennst

Signal

Wenn zwei Quellen widersprechen, braucht das System eine Vorrangregel.

Du erkennst das Problem auch daran, dass Antworten widersprüchliche Aussagen nebeneinanderstellen und fachlich gleich behandeln. Dann hat Retrieval Material gefunden, und das System braucht ein Modell für Autorität.

Üben

Mini-Aufgabe

Ergänze für den Mini-Use-Case zwei weitere Quellen: Systemkatalog und Verantwortlichkeitsnotiz. Bewerte pro Quelle Aktualität, Berechtigung, Autorität, Risiko und Nutzbarkeit.

Musterlösung
Systemkatalog

hohe Nutzbarkeit für Systemstammdaten, mittlere Autorität für Risiken, interne Berechtigung, Risiko bei veralteten Systemnamen.

Verantwortlichkeitsnotiz

aktuelle Hinweise auf Teams, geringe formale Autorität, interne oder teambezogene Berechtigung, Risiko bei fehlendem Stand-Datum.

Für den Practice Brief wäre eine sinnvolle Regel: Offizielle Richtlinien schlagen Notizen bei Pflichten. Systemkatalog schlägt Projektliste bei technischen Systemdetails. Projektliste schlägt Systemkatalog bei Projektzuordnung, wenn sie vom PMO gepflegt wird. Genau solche Vorrangregeln machen spätere Antworten erklärbarer.

Reflektieren

Selbsttest

1.Was sagt Quellenverfügbarkeit aus?

Verfügbarkeit sagt nur, dass eine Quelle technisch erreichbar ist. Für GraphRAG brauchst du zusätzlich Aktualität, Berechtigung, Autorität und Risiko.

2.Was bedeutet Autorität einer Quelle?

Autorität bedeutet: Wie verbindlich ist diese Quelle für die konkrete Frage? Eine Richtlinie hat hohe Autorität für Pflichten. Eine Notiz kann aktuell sein, ist aber meist weniger verbindlich.

3.Was passiert bei widersprüchlichen Quellen?

Das System braucht eine Prioritätsregel. Sie macht sichtbar, welche Quelle Vorrang hat und warum eine Aussage stärker trägt als eine andere.

Kernaussage

Retrieval-Qualität beginnt mit Quellenqualität.

Vorheriger StepNächster Step

Status

Auf dieser Seite

PraxiszielAusgangslageArbeitsprinzipPraxisartefaktQualitätsfehlerDiagnosesignalMini-AufgabeSelbsttest

Vertiefen

Konzept im CompassChunking & Document ProcessingProvenance & Trust

Kernaussage

Retrieval-Qualität beginnt mit Quellenqualität.

Output

source-inventory.json für den Mini-Use-Case

Checkpoint

Du kannst erklären, welche Quellen verwendbar sind und welche Risiken sie ins Retrieval bringen.

Praxis-Modus

Mini-Use-Case statt Tooldemo.

Artefakte nur dort, wo sie eine Entscheidung sichtbar machen.

Herstellerneutral, mit Neo4j nur als spätere Option.