Vector Search
Gut für semantische Nähe, Paraphrasen und natürlich formulierte Fragen. Schwächer bei exakten IDs, Zahlen, kurzen Begriffen und fachlichen Relationen.
Architektur-Detail · Retrieval
Hybrid Retrieval ist eine Orchestrierungsarchitektur: Query Router, Vector Search, Keyword/BM25, Metadatenfilter, optionaler Graph Lookup, Fusion, Deduplizierung, Reranking und Context Assembler. Der Kern ist die messbare Kombination mehrerer Signale mit klaren Failure Modes, Latenzbudget und Rollback.
Kuratierte Architekturentscheidung auf Basis der lokalen Compass-Daten
Relevant wenn
Wenn RAG als Baseline existiert und echte Testfragen zeigen, dass ein zusätzliches Signal wiederholt die richtigen Quellen oder Beziehungen rettet.
Quellenlage
Reales Suchmuster, aber kein einzelner offizieller Produktname. Der Compass fasst hier Vektorsuche, Keyword-Suche, Gewichtung mehrerer Trefferlisten und optional Graphsignale zusammen.
Eine einzelne Suchtechnik liefert in der Praxis falsche oder unvollständige Kontextpakete: semantisch ähnliche Treffer reichen nicht, exakte Begriffe fehlen, Metadaten werden ignoriert oder Graphnachbarschaften bleiben ungenutzt.
Systemkarte
Die Motion Map verdichtet das Muster auf seine wichtigsten Stationen: Eingabe, Daten- oder Graphschicht, Retrieval, Kontrolle und Antwort. Sie ist bewusst kleiner als die Referenzarchitektur darunter und soll zuerst die Leserichtung und die Systemgrenzen sichtbar machen.
Architekturblick
Diese Seite ist eine Entscheidungshilfe für den Stack. Der Blick liegt auf Datenfluss, Failure Modes, Evaluation, Tooling und dem nächsten sinnvollen Migrationsschritt.
Eine Anfrage wird analysiert und parallel oder gestuft an mehrere Retriever geschickt. Trefferlisten aus Vektor, Keyword, Filter und Graph werden normalisiert, dedupliziert, gewichtet, rerankt und erst danach als kompaktes Kontextpaket an das LLM gegeben.
Mit RAG starten, dann das erste klar messbare Fehlermuster ergänzen: exakte Begriffe, Metadaten, Graphnachbarn oder Reranking. Jede neue Signalquelle braucht eine eigene Messung und ein Rollback-Signal.
Referenzarchitektur
Hybrid Retrieval akzeptiert, dass kein Suchsignal allein stabil genug ist. Semantische Nähe, exakte Begriffe, Metadaten und Graphnachbarschaften beantworten unterschiedliche Teile derselben Frage. Die Architekturaufgabe ist deshalb kontrollierte Zusammenführung.
01
Die Anfrage wird nicht sofort an einen einzigen Retriever geschickt. Zuerst wird geklärt, ob sie eher nach Begriffen, Bedeutung, Metadaten oder Beziehungen fragt.
02
Vector Search findet semantisch ähnliche Chunks, Keyword Search findet exakte Begriffe, Filter begrenzen Quellen und Graph Traversal ergänzt Nachbarschaften.
03
Jede Suche liefert ihre eigene Trefferliste: Vektorsuche nach Bedeutung, Keyword-Suche nach exakten Begriffen, Filter nach Metadaten. Diese Listen müssen vergleichbar gemacht, dedupliziert und mit Quelleninformationen zusammengeführt werden.
04
Fusion bedeutet: Aus mehreren Trefferlisten wird eine gemeinsame Rangliste gebaut. Ein Reranker kann diese Kandidaten danach noch einmal gegen die konkrete Frage sortieren.
05
Die finale Auswahl wird als begrenztes Kontextpaket zusammengestellt: Textstellen, Metadaten, gegebenenfalls Entitäten und Pfade.
06
Das LLM antwortet auf Basis dieses Kontextpakets. Gute Architektur macht sichtbar, welche Signale die Antwort getragen haben.
Implementierungs-, Integrations- und Betriebsaufwand.
Qualität, Struktur und Zugänglichkeit der Daten vor dem Pilot.
Erfahrung mit RAG, Graphdenken, Infrastruktur und Evaluation.
Kein einzelnes Fehlermuster belegt ist, keine stabilen Metadaten oder Entitäten existieren oder Latenz und Debug-Aufwand extrem knapp sind.
Mehr Signale erhöhen nicht automatisch Präzision. Fusion kann falsche Scores mischen, Graphsignale hängen an Entity Resolution, und zusätzliche Retriever erhöhen Latenz, Kosten und Beobachtungsbedarf. Ohne Ablation wirkt Hybrid schnell besser, obwohl nur mehr Kontext in den Prompt gelangt.
Signalmodell
Der wichtigste Architekturgedanke: Jedes Signal hat eine eigene Stärke und eine eigene Fehlerklasse. Hybrid Retrieval wird erst wertvoll, wenn diese Signale bewusst getrennt, gemessen und danach fusioniert werden.
Gut für semantische Nähe, Paraphrasen und natürlich formulierte Fragen. Schwächer bei exakten IDs, Zahlen, kurzen Begriffen und fachlichen Relationen.
BM25 ist ein klassisches Suchverfahren für Volltextsuche. Es bewertet, wie gut exakte Wörter aus der Frage in einem Text vorkommen. Gut für Namen, Produktcodes, Gesetzesartikel oder Fehlermeldungen. Schwächer bei Synonymen und impliziter Bedeutung.
Gut, um Suchräume fachlich zu begrenzen: Dokumenttyp, Zeitraum, Sprache, Version, Abteilung, Kunde oder Berechtigungsbereich.
Gut, wenn ein gefundener Einstiegspunkt erweitert werden muss: Nachbarn, Pfade, Abhängigkeiten, Zuständigkeiten oder Entitätskontext.
Qualitätshebel
Hybrid Retrieval verbessert nicht automatisch alles. Ohne getrennte Messung, Deduplizierung und klares Kontextbudget kann es sogar schlechter werden: mehr Treffer, aber weniger Präzision.
Teste dieselbe Fragenliste einmal nur mit Vektorsuche, einmal nur mit Keyword-Suche, einmal nur mit Filtern und einmal kombiniert. So siehst du, ob Hybrid Retrieval wirklich besser wird oder nur mehr Trefferrauschen erzeugt.
Wenn Trefferlisten kombiniert werden, muss entschieden werden, welches Signal stärker zählt: Bedeutungsnähe, exakte Wörter, Aktualität, Quelle oder Graphnähe. Diese Gewichtung sollte aus echten Testfragen entstehen, nicht aus Bauchgefühl.
Mehrere Retriever liefern oft dieselben Chunks oder fast gleiche Passagen. Ohne Deduplizierung verschwendest du Kontextfenster.
Hybrid heißt besser ausgewählter Kontext. Das Kontextpaket muss knapp, begründet und quellenstark bleiben.
Ausbaustufen
Hybrid Retrieval ist oft der pragmatische Mittelweg: stärker als reine Vektorsuche, aber noch nicht so schwer wie ein vollständiger GraphRAG-Stack. Es zeigt sehr gut, ob ein Graphsignal wirklich gebraucht wird oder ob bessere Retrieval-Fusion ausreicht.
Stufe 1
Die Baseline: semantische Suche über Chunks, schnell gebaut und gut vergleichbar.
Stufe 2
Mehrere Suchsignale werden kombiniert, wenn einzelne Retriever systematisch falsche oder unvollständige Treffer liefern.
Stufe 3
Der nächste Schritt, wenn Entitäten, Pfade und Beziehungen als Kern der Antwort gebraucht werden.
Stufe 4
Später wird festgelegt, welche Quellen gesucht werden dürfen, welche Rollen welche Informationen sehen, wie Treffer bewertet werden und welche fachlichen Regeln vor der Antwort gelten.
In welchem Kontext das Muster typischerweise Sinn ergibt und welchen Beitrag es dort leistet.
Eine Frage passt zu mehreren Artikeln, aber nur eine Produktversion und ein Modul sind betroffen.
Vektor-Retrieval liefert Kandidaten, Graphbeziehungen liefern Präzision.
Eine Regel steht im Dokument, relevante Kontrollen und Nachweise liegen im Graph.
Die Antwort kombiniert Textstelle und Beziehungspfad.
Ein Nutzer sucht nach Fehlercode E-104. Keyword-Suche findet den exakten Fehlercode, Vektorsuche findet ähnlich beschriebene Symptome, ein Metadatenfilter begrenzt alles auf Produktversion 3.2.
Hybrid Retrieval ist sinnvoll, weil exakte Begriffe, Bedeutungsnähe und strukturierte Filter zusammen bessere Treffer liefern als ein einzelnes Suchsignal.
Vector-only, Keyword-only und Hybrid mit derselben Fragenliste vergleichen
Fusion- und Deduplizierungsregel festlegen
Latenz, Quellenabdeckung und Kontextbudget messen