Phase 2 · Praxis-Step 2 von 9

Quellen inventarisieren

Quellen als Qualitätsobjekte mit Typ, Besitzer, Aktualität, Berechtigung, Autorität und Risiko behandeln.

Was du mitnimmst

Retrieval-Qualität beginnt mit Quellenqualität.

Praxisziel

Was du praktisch entscheidest

Du erstellst ein Quelleninventar mit Typ, Besitzer, Aktualität, Berechtigung, Autorität und Risiko. Damit weißt du vor dem Retrieval, welche Quellen verlässlich tragen und welche Quellen nur vorsichtig genutzt werden sollten.

Szenario

Ausgangslage im Mini-Use-Case

Im Mini-Use-Case liegen vier Quellen vor: eine Richtlinie als PDF, eine Projektliste als Tabelle, ein Systemkatalog als Wiki-Seite und eine Verantwortlichkeitsnotiz. Alle vier klingen relevant. Jede Quelle hat eine eigene Autorität, Aktualität und Struktur.

Die Richtlinie ist wahrscheinlich maßgeblich für Pflichten. Die Projektliste ist wahrscheinlich gut für Zuordnungen. Der Systemkatalog ist gut für technische Stammdaten. Die Verantwortlichkeitsnotiz kann aktuelle Hinweise liefern und braucht eine formale Einordnung. Diese Unterschiede müssen sichtbar werden, bevor Retrieval oder Graphaufbau starten.

In echten Projekten wird diese Arbeit oft übersprungen. Dann landet alles im selben Index und das System behandelt jedes Fragment so, als hätte es denselben Beweiswert. Genau dadurch entstehen Antworten, die formal "eine Quelle" haben, aber fachlich schwach sind.

Heuristik

Arbeitsprinzip

Behandle Quellen als bewertete Objekte. Jede Quelle braucht eine Rolle: Belegt sie Regeln, liefert sie Stammdaten, beschreibt sie aktuelle Zuständigkeiten oder erzeugt sie nur Kontext?

Eine Quelle kann je nach Frage eine andere Rolle haben. Eine Tabelle trägt Projekt-System-Zuordnungen. Eine Richtlinie trägt Prüfpflichten. Ein Systemkatalog trägt aktuelle Systemverantwortung, wenn er dafür gepflegt wird. Das Inventar macht diese Quellenrollen früh sichtbar.

Drei Felder sind dabei besonders wichtig:

Feld	Einfache Bedeutung
Berechtigung	Wer darf diese Quelle oder Teile daraus sehen?
Autorität	Wie verbindlich ist die Quelle für die konkrete Frage?
Risiko	Was kann bei dieser Quelle schiefgehen: veraltet, widersprüchlich, schwer lesbar, unvollständig oder nur eingeschränkt nutzbar?

Greifbar machen

Praxisartefakt

Das Quelleninventar ist ein kompaktes JSON-Artefakt. Es zeigt die vorhandenen Quellen und ihre Rolle für die Frageklasse.

Praxis-Hinweis: In der Umsetzung liegt dieses Inventar oft als Tabelle, Datenkatalog oder Confluence-Seite vor. Wichtig ist, dass Besitzer, Aktualität, Berechtigung, Autorität und Risiko vor der technischen Verarbeitung gepflegt werden. Später werden genau diese Felder als Metadaten, Filter und Prioritätsregeln in Retrieval, Graphaufbau und Antwortprüfung genutzt.

source-inventory.jsonjson

{
  "sources": [
    {
      "source_id": "policy-a",
      "title": "Richtlinie A",
      "type": "pdf",
      "owner": "Compliance",
      "updated_at": "2026-04",
      "permission_scope": "internal",
      "authority_for": ["Prüfpflichten", "Regelbelege", "Gültigkeit"],
      "risk": "Tabellen und Fußnoten können beim Parsing verloren gehen"
    },
    {
      "source_id": "project-list",
      "title": "Projektliste",
      "type": "table",
      "owner": "PMO",
      "updated_at": "monatlich",
      "permission_scope": "internal",
      "authority_for": ["Projekt-System-Zuordnung"],
      "risk": "Systemnamen sind uneinheitlich"
    }
  ],
  "priority_rule": "Offizielle Richtlinien tragen Pflichten. Projektlisten tragen Projektzuordnungen."
}

Schlüssel kurz erklärt

source_id ist die stabile technische Kennung der Quelle.
type beschreibt den Quellentyp.
owner benennt die verantwortliche Stelle.
updated_at zeigt den Stand.
permission_scope steuert Sichtbarkeit.
authority_for sagt, für welche Aussagen die Quelle tragfähig ist.
risk hält fest, was bei dieser Quelle schiefgehen kann.

Achten auf

Typischer Qualitätsfehler

Worauf du achten musst

Alle Quellen werden gleich behandelt. Später überschreibt dann eine veraltete Tabelle eine aktuelle Richtlinie oder eine Notiz wirkt genauso belastbar wie ein offizielles Dokument.

Ein weiterer typischer Fehler ist die fehlende Besitzfrage. Wenn niemand für eine Quelle verantwortlich ist, kann auch niemand klären, ob sie aktuell, vollständig oder fachlich verbindlich ist. Für GraphRAG ist Ownership Teil der Vertrauensbasis.

Prüfen

Woran du es erkennst

Signal

Wenn zwei Quellen widersprechen, braucht das System eine Vorrangregel.

Du erkennst das Problem auch daran, dass Antworten widersprüchliche Aussagen nebeneinanderstellen und fachlich gleich behandeln. Dann hat Retrieval Material gefunden, und das System braucht ein Modell für Autorität.

Üben

Mini-Aufgabe

Ergänze für den Mini-Use-Case zwei weitere Quellen: Systemkatalog und Verantwortlichkeitsnotiz. Bewerte pro Quelle Aktualität, Berechtigung, Autorität, Risiko und Nutzbarkeit.

Musterlösung

Systemkatalog

hohe Nutzbarkeit für Systemstammdaten, mittlere Autorität für Risiken, interne Berechtigung, Risiko bei veralteten Systemnamen.

Verantwortlichkeitsnotiz

aktuelle Hinweise auf Teams, geringe formale Autorität, interne oder teambezogene Berechtigung, Risiko bei fehlendem Stand-Datum.

Für den Practice Brief wäre eine sinnvolle Regel: Offizielle Richtlinien schlagen Notizen bei Pflichten. Systemkatalog schlägt Projektliste bei technischen Systemdetails. Projektliste schlägt Systemkatalog bei Projektzuordnung, wenn sie vom PMO gepflegt wird. Genau solche Vorrangregeln machen spätere Antworten erklärbarer.

Reflektieren

Selbsttest

1.Was sagt Quellenverfügbarkeit aus?

Verfügbarkeit sagt nur, dass eine Quelle technisch erreichbar ist. Für GraphRAG brauchst du zusätzlich Aktualität, Berechtigung, Autorität und Risiko.

2.Was bedeutet Autorität einer Quelle?

Autorität bedeutet: Wie verbindlich ist diese Quelle für die konkrete Frage? Eine Richtlinie hat hohe Autorität für Pflichten. Eine Notiz kann aktuell sein, ist aber meist weniger verbindlich.

3.Was passiert bei widersprüchlichen Quellen?

Das System braucht eine Prioritätsregel. Sie macht sichtbar, welche Quelle Vorrang hat und warum eine Aussage stärker trägt als eine andere.

Kernaussage

Retrieval-Qualität beginnt mit Quellenqualität.

Vorheriger Step Nächster Step

Phase 2 · Praxis-Step 2 von 9

Quellen inventarisieren

Quellen als Qualitätsobjekte mit Typ, Besitzer, Aktualität, Berechtigung, Autorität und Risiko behandeln.

Was du mitnimmst

Retrieval-Qualität beginnt mit Quellenqualität.

Praxisziel

Was du praktisch entscheidest

Szenario

Ausgangslage im Mini-Use-Case

Heuristik

Arbeitsprinzip

Behandle Quellen als bewertete Objekte. Jede Quelle braucht eine Rolle: Belegt sie Regeln, liefert sie Stammdaten, beschreibt sie aktuelle Zuständigkeiten oder erzeugt sie nur Kontext?

Drei Felder sind dabei besonders wichtig:

Feld	Einfache Bedeutung
Berechtigung	Wer darf diese Quelle oder Teile daraus sehen?
Autorität	Wie verbindlich ist die Quelle für die konkrete Frage?
Risiko	Was kann bei dieser Quelle schiefgehen: veraltet, widersprüchlich, schwer lesbar, unvollständig oder nur eingeschränkt nutzbar?

Greifbar machen

Praxisartefakt

Das Quelleninventar ist ein kompaktes JSON-Artefakt. Es zeigt die vorhandenen Quellen und ihre Rolle für die Frageklasse.

source-inventory.jsonjson

{
  "sources": [
    {
      "source_id": "policy-a",
      "title": "Richtlinie A",
      "type": "pdf",
      "owner": "Compliance",
      "updated_at": "2026-04",
      "permission_scope": "internal",
      "authority_for": ["Prüfpflichten", "Regelbelege", "Gültigkeit"],
      "risk": "Tabellen und Fußnoten können beim Parsing verloren gehen"
    },
    {
      "source_id": "project-list",
      "title": "Projektliste",
      "type": "table",
      "owner": "PMO",
      "updated_at": "monatlich",
      "permission_scope": "internal",
      "authority_for": ["Projekt-System-Zuordnung"],
      "risk": "Systemnamen sind uneinheitlich"
    }
  ],
  "priority_rule": "Offizielle Richtlinien tragen Pflichten. Projektlisten tragen Projektzuordnungen."
}

Schlüssel kurz erklärt

source_id ist die stabile technische Kennung der Quelle.
type beschreibt den Quellentyp.
owner benennt die verantwortliche Stelle.
updated_at zeigt den Stand.
permission_scope steuert Sichtbarkeit.
authority_for sagt, für welche Aussagen die Quelle tragfähig ist.
risk hält fest, was bei dieser Quelle schiefgehen kann.

Achten auf

Typischer Qualitätsfehler

Worauf du achten musst

Alle Quellen werden gleich behandelt. Später überschreibt dann eine veraltete Tabelle eine aktuelle Richtlinie oder eine Notiz wirkt genauso belastbar wie ein offizielles Dokument.

Prüfen

Woran du es erkennst

Signal

Wenn zwei Quellen widersprechen, braucht das System eine Vorrangregel.

Üben

Mini-Aufgabe

Ergänze für den Mini-Use-Case zwei weitere Quellen: Systemkatalog und Verantwortlichkeitsnotiz. Bewerte pro Quelle Aktualität, Berechtigung, Autorität, Risiko und Nutzbarkeit.

Musterlösung

Systemkatalog

hohe Nutzbarkeit für Systemstammdaten, mittlere Autorität für Risiken, interne Berechtigung, Risiko bei veralteten Systemnamen.

Verantwortlichkeitsnotiz

aktuelle Hinweise auf Teams, geringe formale Autorität, interne oder teambezogene Berechtigung, Risiko bei fehlendem Stand-Datum.

Reflektieren

Selbsttest

1.Was sagt Quellenverfügbarkeit aus?

Verfügbarkeit sagt nur, dass eine Quelle technisch erreichbar ist. Für GraphRAG brauchst du zusätzlich Aktualität, Berechtigung, Autorität und Risiko.

2.Was bedeutet Autorität einer Quelle?

Autorität bedeutet: Wie verbindlich ist diese Quelle für die konkrete Frage? Eine Richtlinie hat hohe Autorität für Pflichten. Eine Notiz kann aktuell sein, ist aber meist weniger verbindlich.

3.Was passiert bei widersprüchlichen Quellen?

Das System braucht eine Prioritätsregel. Sie macht sichtbar, welche Quelle Vorrang hat und warum eine Aussage stärker trägt als eine andere.

Kernaussage

Retrieval-Qualität beginnt mit Quellenqualität.

Vorheriger Step Nächster Step