Vektorähnlichkeit
Findet semantisch ähnliche Chunks, auch wenn Frage und Dokument unterschiedliche Wörter nutzen.
Deep Dive · Hybrid Retrieval
Hybrid Retrieval verbindet semantische Suche, Filter, Keyword-Signale, Graphkontext und Reranking. Es ist der pragmatische Schritt, wenn RAG zu breit ist, aber ein vollständiger GraphRAG-Ansatz noch zu groß wäre.
Kuratierter erster Schnitt · Stand Mai 2026
Hybrid Retrieval sagt: Eine einzige Suchlogik reicht selten für produktive RAG-Systeme. findet semantische Nähe, aber Metadaten, Keywords, Zeitbezug und Graphbeziehungen können die Treffer präziser und belastbarer machen.
Der Kern ist kontrollierte Kombination. Ein gutes Hybrid Retrieval erklärt, welches Signal wann zählt und wie aus mehreren Trefferlisten ein kleines, gutes Kontextpaket wird.
Hybrid Retrieval beginnt mit der Frage, welche Signale in der Domäne wirklich helfen. Jedes System braucht eine bewusst ausgewählte Signalmenge.
Findet semantisch ähnliche Chunks, auch wenn Frage und Dokument unterschiedliche Wörter nutzen.
Stark bei exakten Begriffen, IDs, Fehlermeldungen, Produktnamen oder regulatorischen Referenzen.
Grenzt Treffer nach Quelle, Version, Sprache, Datum, Dokumenttyp oder Berechtigung ein.
Ergänzt relevante Entitäten, Beziehungen, Pfade oder abhängige Objekte aus einem Graph.
Bevorzugt aktuelle, gültige oder zeitraumbezogene Informationen und hält alte Treffer einordenbar.
Sortiert Kandidaten nach Frage-Relevanz neu und reduziert ähnlich klingende, aber fachlich falsche Treffer.
Die eigentliche Architekturentscheidung liegt oft in der Fusion: Werden Treffer vorher gefiltert, parallel gesucht, gewichtet oder nachträglich gererankt?
Metadaten oder Berechtigungen begrenzen zuerst den Suchraum. Danach laufen Vektor-, Keyword- oder Graphsuche nur auf erlaubten Kandidaten.
Mehrere Retriever laufen nebeneinander. Die Trefferlisten werden danach zusammengeführt und dedupliziert.
Treffer werden danach bewertet, wie weit oben sie in mehreren Listen stehen. Das ist robust, wenn Scores nicht direkt vergleichbar sind.
Signale bekommen Gewichte, zum Beispiel 60 Prozent Vektor, 25 Prozent Keyword, 15 Prozent Graph. Das ist flexibel, aber tuning-intensiv.
Nach der Zusammenführung bewertet ein Reranker die Kandidaten erneut gegen die konkrete Frage.
Eine Hybrid-Pipeline ist eine Reihe von Auswahlentscheidungen: Welche Signale starten, wie Treffer fusioniert werden, und was am Ende wirklich in den Prompt kommt.
Frage verstehen: Entitäten, Zeitraum, Quelle, Berechtigung und erwartete Antwortform erkennen.
Mehrere Retriever auslösen: Vektor, Keyword, Metadaten, Graph oder domänenspezifische Suche.
Kandidaten zusammenführen: Deduplizieren, Scores normalisieren, Quellen gruppieren.
Reranken: Die besten Kandidaten nach Relevanz zur Frage neu sortieren.
Kontextpaket bauen: Wenige belastbare Chunks, Graphpfade und Quellenstellen an das LLM geben.
Antwort evaluieren: Prüfen, welches Signal wirklich zur richtigen Antwort beigetragen hat.
Hybrid Retrieval wird greifbar, wenn eine Frage semantische Suche braucht, aber Produktversion, Modul und technische Beziehungen die richtigen Treffer eingrenzen.
Warum schlägt Login für Kunden auf Version 4.2 nach der Reporting-Migration fehl?
Vektortreffer
Filter
Graphkontext
Die finale Antwort nutzt den aktuellen Release-Abschnitt, den passenden Supportartikel und den Graphpfad vom betroffenen Service zur geänderten Authentifizierung.
Mehr Qualität, mehr Tuning
Jedes Signal kann helfen, aber jedes Signal braucht Gewichtung, Tests und Pflege.
Mehr Latenz
Mehrere Retriever, Fusion und Reranking kosten Zeit. Parallelisierung und Caching werden schnell wichtig.
Mehr Evaluation
Man muss messen, welches Signal welchen Beitrag leistet. Sonst wird Hybrid Retrieval zur Black Box.
Zu viele Signale
Wenn alles kombiniert wird, wird das Ergebnis schwer erklärbar. Gute Hybrid-Systeme sind bewusst sparsam.
Hybrid Retrieval reicht oft, wenn Beziehungen punktuell helfen, aber kein großer GraphRAG-Index, keine Global Search und keine umfassende Graphpflege nötig sind. Sobald Fragen systematisch über viele Beziehungspfade, Communities oder Graphsummaries laufen, wird plausibler.
Evaluation
Hybrid Retrieval sollte nicht als großes Kombinationspaket bewertet werden. Besser ist eine Ablation: Signal für Signal prüfen, was wirklich Qualität bringt.
Hybrid Retrieval wird greifbarer, wenn Scores und Entscheidungsgründe gemeinsam sichtbar werden: Ein Kandidat kann trotz guter Vektorähnlichkeit zurückfallen.
Hybrid Retrieval nutzt oft Konzepte aus mehreren Ebenen: für semantische Breite, für Beziehungen und Reranking für die finale Kontextauswahl.
Semantische Kandidaten für dokumentennahe Fragen.
Explizite Beziehungen, Nachbarschaften und Pfade.
Wenn Graphkontext selbst zum primären Retrieval-Modell wird.
Praxisentscheidung
Der beste Einstieg ist ein kleiner Signal-Mix. Starte mit RAG plus einem zweiten Signal: Metadatenfilter, Keyword-Suche oder Graphnachbarschaft. Sobald der Nutzen messbar ist, lohnt sich komplexere Fusion.
Nächste Schritte