Business Glossar
Definiert Fachbegriffe wie Umsatz, Kunde, aktiver Vertrag oder Risiko. Ohne Glossar bleibt Text-to-SQL eine Übersetzung technischer Tabellen.
Architektur-Detail · Datenzugriff
Ein Schema-Graph modelliert nur die fachlich relevanten Tabellen, Felder, Begriffe und Beziehungen — der LLM bekommt den kontextrelevanten Subgraph statt des vollständigen Schemas. 20–30 % weniger Tokens, messbar bessere Join-Qualität und explizite Domänenlogik statt implizitem Tabellenwissen.
Kuratierte Architekturentscheidung auf Basis der lokalen Compass-Daten
Relevant wenn
Wenn Text-to-SQL über komplexe Schemas fehlerhaft ist und das vollständige Schema den LLM-Kontext überlädt.
Quellenlage
Compass-Komposition aus realen Semantic-Layer- und Text-to-SQL-Mustern. Es gibt Primärquellen zu Semantic Layer, SQL Agents und Zugriffskontrolle, aber nicht genau diesen Compass-Namen als Standardarchitektur.
LLM erzeugt fehlerhafte SQL-Abfragen, weil das Datenbankschema zu groß, zu technisch oder zu unverständlich ist.
Systemkarte
Die Motion Map verdichtet das Muster auf seine wichtigsten Stationen: Eingabe, Daten- oder Graphschicht, Retrieval, Kontrolle und Antwort. Sie ist bewusst kleiner als die Referenzarchitektur darunter und soll zuerst die Leserichtung und die Systemgrenzen sichtbar machen.
Architekturblick
Diese Seite ist eine Entscheidungshilfe für den Stack. Der Blick liegt auf Datenfluss, Failure Modes, Evaluation, Tooling und dem nächsten sinnvollen Migrationsschritt.
Fachbegriffe werden auf Metriken, Tabellen, Joins und Regeln gemappt. Erst dann erzeugt das LLM SQL gegen einen begrenzten Schema-Ausschnitt, der validiert und protokolliert wird.
Mit wenigen Fachfragen und Metriken starten, dann Schema-Subgraph, Policies, Validierung und versionierte Metrikdefinitionen ergänzen.
Referenzarchitektur
Diese Architektur übersetzt nicht einfach Sprache in SQL. Sie baut eine kontrollierte Bedeutungsschicht zwischen Fachfrage und Datenbankschema. Das Modell bekommt nur den relevanten Schema-Ausschnitt, fachliche Definitionen und erlaubte Operationen. Dadurch wird Text-to-SQL weniger ein Prompt-Trick und mehr eine governancefähige Abfragearchitektur.
01
Nutzer fragen in Fachsprache: Umsatz, aktive Kunden, offene Risiken oder Marge. Diese Begriffe sind selten identisch mit Tabellen- und Spaltennamen.
02
Der Semantic Layer klärt, welche Metrik, Definition, Zeitebene, Datenquelle und Berechnungsregel gemeint ist.
03
Statt das gesamte Datenbankschema in den Prompt zu geben, wird nur der relevante Ausschnitt aus Tabellen, Feldern, Joins und Regeln bereitgestellt.
04
Das LLM generiert SQL gegen einen begrenzten, fachlich erklärten Kontext. Dadurch sinkt die Wahrscheinlichkeit falscher Joins und falscher Kennzahlen.
05
Policies prüfen Tabellenzugriff, Aggregationen, Zeilenlimits, gefährliche Operationen und Rollen. Fehler werden vor der Ausführung abgefangen.
06
Die Antwort sollte Ergebnis, Kennzahl, Quelle, Filter, Zeitraum und SQL-Logik nachvollziehbar machen.
Implementierungs-, Integrations- und Betriebsaufwand.
Qualität, Struktur und Zugänglichkeit der Daten vor dem Pilot.
Erfahrung mit RAG, Graphdenken, Infrastruktur und Evaluation.
Schema und Fachdomäne häufig wechseln oder kaum fachliche Governance existiert.
Schema-Graph muss manuell gepflegt werden und mit der echten Datenbank synchron bleiben. Nur wirksam wenn die Domäne klar abgrenzbar ist — breite, dynamisch wachsende Schemas sind schwer vollständig zu modellieren.
Bausteine
Der Semantic Layer ist hier kein hübscher Name für Dokumentation. Er ist der kontrollierte Kontext, der entscheidet, welche Bedeutung, Tabellen, Joins, Metriken und Regeln für eine Frage gelten.
Definiert Fachbegriffe wie Umsatz, Kunde, aktiver Vertrag oder Risiko. Ohne Glossar bleibt Text-to-SQL eine Übersetzung technischer Tabellen.
Modelliert Tabellen, Spalten, Beziehungen, Joins, Kardinalitäten und relevante Datenprodukte als abfragbaren Kontext.
Kennzahlen brauchen Formel, Filter, Zeitraum, Aggregationslogik und Verantwortlichkeit. Sonst produziert das Modell plausible, aber falsche Zahlen.
Regelt, wer welche Daten sehen darf, welche Operationen erlaubt sind und wann eine Abfrage abgelehnt oder eskaliert wird.
Qualitätshebel
Text-to-SQL wirkt schnell beeindruckend, bis falsche Kennzahlen, falsche Joins oder unerlaubte Daten in Antworten landen. Der Semantic Layer soll genau diese Fehlerklassen sichtbar und prüfbar machen.
Bewerte, ob SQL syntaktisch läuft und ob Joins fachlich korrekt sind, ohne Zeilen zu vervielfachen oder Daten zu verlieren.
Wenn sich Metrikdefinitionen ändern, muss nachvollziehbar bleiben, welche Antwort mit welcher Definition erzeugt wurde.
Wenn ein Begriff mehrdeutig ist, soll das System nachfragen oder ablehnen, statt eine willkürliche Tabelle zu wählen.
Für analytische Nutzung sollte die generierte Logik prüfbar sein: verwendete Tabellen, Filter, Zeitraum und Annahmen gehören in die Antwort.
Ausbaustufen
Ein Semantic Layer kann klein starten. Entscheidend ist, dass er Begriffsdefinitionen, Abfragen, Rechte, Metriken und Verantwortlichkeiten gemeinsam kontrolliert.
Stufe 1
Starte mit 20 echten Fachfragen, Begriffen, Tabellen und erwarteten SQL-Mustern.
Stufe 2
Baue einen kleinen Graphen aus Tabellen, Spalten, Beziehungen, Metriken und erlaubten Joins.
Stufe 3
Führe SQL nur nach Validierung, Rollenprüfung und Limitierung aus. Speichere Frage, SQL und Ergebnis für Evaluation.
Stufe 4
Erweitere auf Metrik-Governance, Datenprodukte, Ownership, Versionierung und Agentenaktionen.
In welchem Kontext das Muster typischerweise Sinn ergibt und welchen Beitrag es dort leistet.
Nutzer fragen nach Umsatz oder aktiven Kunden, kennen aber das Datenbankschema nicht.
Der Semantic Layer begrenzt und übersetzt die Abfrage auf fachlich erlaubte Konzepte.
Metriken haben je Team unterschiedliche Definitionen.
Gemeinsame Regeln reduzieren widersprüchliche SQL-Generierung.
Ein Fachnutzer fragt: Wie hoch war der wiederkehrende Umsatz im letzten Quartal? In der Datenbank heißen die Tabellen aber subscriptions, invoices und account_events.
Der Semantic Layer erklärt dem System, welche Tabellen, Joins, Filter und Kennzahlendefinitionen für diese Frage erlaubt und fachlich korrekt sind.
Kritische SQL-Fragen sammeln
Fachbegriffe auf Tabellen mappen
Join-Fehler vor/nach Semantic Layer messen