Phase 2 · Praxis-Step 2 von 9
Quellen als Qualitätsobjekte mit Typ, Besitzer, Aktualität, Berechtigung, Autorität und Risiko behandeln.
Was du mitnimmst
Retrieval-Qualität beginnt mit Quellenqualität.

Praxisziel
Du erstellst ein Quelleninventar mit Typ, Besitzer, Aktualität, Berechtigung, Autorität und Risiko. Damit weißt du vor dem Retrieval, welche Quellen verlässlich tragen und welche Quellen nur vorsichtig genutzt werden sollten.
Szenario
Im Mini-Use-Case liegen vier Quellen vor: eine Richtlinie als PDF, eine Projektliste als Tabelle, ein Systemkatalog als Wiki-Seite und eine Verantwortlichkeitsnotiz. Alle vier klingen relevant. Jede Quelle hat eine eigene Autorität, Aktualität und Struktur.
Die Richtlinie ist wahrscheinlich maßgeblich für Pflichten. Die Projektliste ist wahrscheinlich gut für Zuordnungen. Der Systemkatalog ist gut für technische Stammdaten. Die Verantwortlichkeitsnotiz kann aktuelle Hinweise liefern und braucht eine formale Einordnung. Diese Unterschiede müssen sichtbar werden, bevor Retrieval oder Graphaufbau starten.
In echten Projekten wird diese Arbeit oft übersprungen. Dann landet alles im selben Index und das System behandelt jedes Fragment so, als hätte es denselben Beweiswert. Genau dadurch entstehen Antworten, die formal "eine Quelle" haben, aber fachlich schwach sind.
Heuristik
Behandle Quellen als bewertete Objekte. Jede Quelle braucht eine Rolle: Belegt sie Regeln, liefert sie Stammdaten, beschreibt sie aktuelle Zuständigkeiten oder erzeugt sie nur Kontext?
Eine Quelle kann je nach Frage eine andere Rolle haben. Eine Tabelle trägt Projekt-System-Zuordnungen. Eine Richtlinie trägt Prüfpflichten. Ein Systemkatalog trägt aktuelle Systemverantwortung, wenn er dafür gepflegt wird. Das Inventar macht diese Quellenrollen früh sichtbar.
Drei Felder sind dabei besonders wichtig:
| Feld | Einfache Bedeutung |
|---|---|
| Berechtigung | Wer darf diese Quelle oder Teile daraus sehen? |
| Autorität | Wie verbindlich ist die Quelle für die konkrete Frage? |
| Risiko | Was kann bei dieser Quelle schiefgehen: veraltet, widersprüchlich, schwer lesbar, unvollständig oder nur eingeschränkt nutzbar? |
Greifbar machen
Das Quelleninventar ist ein kompaktes JSON-Artefakt. Es zeigt die vorhandenen Quellen und ihre Rolle für die Frageklasse.
Praxis-Hinweis: In der Umsetzung liegt dieses Inventar oft als Tabelle, Datenkatalog oder Confluence-Seite vor. Wichtig ist, dass Besitzer, Aktualität, Berechtigung, Autorität und Risiko vor der technischen Verarbeitung gepflegt werden. Später werden genau diese Felder als Metadaten, Filter und Prioritätsregeln in Retrieval, Graphaufbau und Antwortprüfung genutzt.
{
"sources": [
{
"source_id": "policy-a",
"title": "Richtlinie A",
"type": "pdf",
"owner": "Compliance",
"updated_at": "2026-04",
"permission_scope": "internal",
"authority_for": ["Prüfpflichten", "Regelbelege", "Gültigkeit"],
"risk": "Tabellen und Fußnoten können beim Parsing verloren gehen"
},
{
"source_id": "project-list",
"title": "Projektliste",
"type": "table",
"owner": "PMO",
"updated_at": "monatlich",
"permission_scope": "internal",
"authority_for": ["Projekt-System-Zuordnung"],
"risk": "Systemnamen sind uneinheitlich"
}
],
"priority_rule": "Offizielle Richtlinien tragen Pflichten. Projektlisten tragen Projektzuordnungen."
}Schlüssel kurz erklärt
source_id ist die stabile technische Kennung der Quelle.type beschreibt den Quellentyp.owner benennt die verantwortliche Stelle.updated_at zeigt den Stand.permission_scope steuert Sichtbarkeit.authority_for sagt, für welche Aussagen die Quelle tragfähig ist.risk hält fest, was bei dieser Quelle schiefgehen kann.Achten auf
Worauf du achten musst
Alle Quellen werden gleich behandelt. Später überschreibt dann eine veraltete Tabelle eine aktuelle Richtlinie oder eine Notiz wirkt genauso belastbar wie ein offizielles Dokument.
Ein weiterer typischer Fehler ist die fehlende Besitzfrage. Wenn niemand für eine Quelle verantwortlich ist, kann auch niemand klären, ob sie aktuell, vollständig oder fachlich verbindlich ist. Für GraphRAG ist Ownership Teil der Vertrauensbasis.
Prüfen
Signal
Wenn zwei Quellen widersprechen, braucht das System eine Vorrangregel.
Du erkennst das Problem auch daran, dass Antworten widersprüchliche Aussagen nebeneinanderstellen und fachlich gleich behandeln. Dann hat Retrieval Material gefunden, und das System braucht ein Modell für Autorität.
Üben
Ergänze für den Mini-Use-Case zwei weitere Quellen: Systemkatalog und Verantwortlichkeitsnotiz. Bewerte pro Quelle Aktualität, Berechtigung, Autorität, Risiko und Nutzbarkeit.
hohe Nutzbarkeit für Systemstammdaten, mittlere Autorität für Risiken, interne Berechtigung, Risiko bei veralteten Systemnamen.
aktuelle Hinweise auf Teams, geringe formale Autorität, interne oder teambezogene Berechtigung, Risiko bei fehlendem Stand-Datum.
Für den Practice Brief wäre eine sinnvolle Regel: Offizielle Richtlinien schlagen Notizen bei Pflichten. Systemkatalog schlägt Projektliste bei technischen Systemdetails. Projektliste schlägt Systemkatalog bei Projektzuordnung, wenn sie vom PMO gepflegt wird. Genau solche Vorrangregeln machen spätere Antworten erklärbarer.
Reflektieren
Verfügbarkeit sagt nur, dass eine Quelle technisch erreichbar ist. Für GraphRAG brauchst du zusätzlich Aktualität, Berechtigung, Autorität und Risiko.
Autorität bedeutet: Wie verbindlich ist diese Quelle für die konkrete Frage? Eine Richtlinie hat hohe Autorität für Pflichten. Eine Notiz kann aktuell sein, ist aber meist weniger verbindlich.
Das System braucht eine Prioritätsregel. Sie macht sichtbar, welche Quelle Vorrang hat und warum eine Aussage stärker trägt als eine andere.
Kernaussage
Retrieval-Qualität beginnt mit Quellenqualität.