Zum Inhalt springen
GraphRAG Compass
  • Grundlagen
  • Architekturen
  • Praxis
  • Business Cases
  • Lernpfad
  • Simulation
  • Landkarte
GraphRAG Compass

Öffentlicher Field Guide für GraphRAG, Knowledge Graphs, AI-Architekturen und bessere Entscheidungen in komplexen Wissenssystemen.

Erkunden

  • Grundlagen
  • Architekturen
  • Praxis
  • Business Cases
  • Simulation
  • Landkarte

Lernen

  • Lernpfad
  • Mini-Use-Case
  • GraphRAG Poster
  • Glossar

Über

  • About
  • LinkedIn

Discovery

  • llms.txt
  • llms-full.txt
  • sitemap.xml

Rechtliches

  • Impressum
  • Datenschutz

© 2026 Meierhoff Systems · GraphRAG Compass

Orientierung für Entscheidungen in Wissenssystemen

Zurück zu Konzept

Konzept-Detail

Vektorindex

Suchindex für Embeddings, der ähnliche Vektoren schnell auffindbar macht.

Production
Similarity Search
Approximate Nearest Neighbor
Recall@k

Kuratierte Konzeptseite auf Basis der lokalen Compass-Daten

Die Grundidee

Ein Vektorindex ist die Suchstruktur hinter semantischer Suche. Embeddings sind nur Koordinaten im Vektorraum; der Index sorgt dafür, dass ähnliche Vektoren schnell gefunden werden, auch wenn Millionen von Chunks, Dokumenten oder Objekten durchsucht werden müssen. In großen Beständen passiert das oft über ANN: eine schnelle Näherungssuche, die fast dieselben Treffer findet, aber nicht jeden Vektor exakt vergleicht.

Orientierungsfrage

Wird wichtig, sobald semantische Suche über viele Chunks, Dokumente oder Objekte skalieren und messbar bleiben soll.

Motion Map

Vektorindex

SuchnetzNäherung
Frage
Embedding
ANN / HNSW
Top-k
Index
Kandidaten
Kontext

ANN/HNSW reduziert den Suchraum, bevor Top-k den Antwortkontext bestimmt.

Embedding, Index und Suche

Was der Vektorindex leistet

Embedding

Das Modell erzeugt Vektoren

Ein Embedding-Modell übersetzt Text, Bilder oder Objekte in Vektoren. Diese Vektoren repräsentieren Bedeutung, sind aber noch keine schnelle Suchmaschine.

Index

Der Index macht Ähnlichkeit auffindbar

Der Vektorindex organisiert Embeddings für Similarity Search. Approximate Nearest Neighbor, kurz ANN, beschleunigt die Suche, indem nicht der komplette Bestand geprüft wird. Das verbessert Latenz und Kosten, kann aber je nach Einstellung relevante Treffer verpassen.

HNSW

Ein Nachbarschaftsnetz führt schnell zum Ziel

HNSW ist ein verbreitetes ANN-Verfahren. Es organisiert Vektoren wie ein mehrstufiges Nachbarschaftsnetz: Die Suche startet grob, springt von Knoten zu Knoten näher an den Zielbereich und prüft am Ende nur noch gute Kandidaten statt den ganzen Bestand.

Retrieval

Top-k und Filter bestimmen den Kontext

Die Suche liefert die ähnlichsten Kandidaten. Top-k, Metadatenfilter, Schwellenwerte und spätere Reranker entscheiden, was am Ende wirklich in das Kontextpaket kommt.

Wofür ein Vektorindex praktisch gut ist

Ein Vektorindex ist die Basis für RAG, semantische Suche und viele Hybrid-Retrieval-Stacks. Er ist kein Knowledge Graph, aber oft die erste Baseline, gegen die GraphRAG seinen Mehrwert zeigen muss.

Wie man klein beginnt

Ein guter Start ist ein kleiner Index mit repräsentativen Chunks, Metadatenfiltern und Golden Questions. Danach misst man Recall@k, prüft falsche ähnliche Treffer und entscheidet, ob ANN-Parameter, Top-k, Hybrid Retrieval oder Graphkontext angepasst werden müssen.

Konkrete Beispiele

Die Beispiele zeigen den Vektorindex als Retrieval-Baustein zwischen Embedding-Modell, Vektordatenbank und GraphRAG-Architektur.

Millionen Chunks durchsuchen

Ein Dokumentbestand wächst von tausend auf mehrere Millionen Textabschnitte.

ANN macht Similarity Search schnell genug, weil nicht jeder Vektor vollständig mit der Anfrage verglichen werden muss.

HNSW als Suchnetz verstehen

Ein Team sieht in einer Vektordatenbank Einstellungen wie HNSW, efSearch oder M und will wissen, warum das Retrieval dadurch schneller oder genauer wird.

HNSW ist ein ANN-Verfahren: ein mehrstufiges Nachbarschaftsnetz, das die Suche Schritt für Schritt in Richtung ähnlicher Kandidaten führt.

Recall@k messen

Golden Questions haben erwartete Quellen, aber relevante Chunks erscheinen nicht unter den ersten Treffern.

Top-k, Filter und ANN-Einstellungen werden als Retrieval-Qualität sichtbar, nicht als Modellgefühl.

Toolgrenze verstehen

Ein Team vergleicht FAISS, pgvector, Pinecone, Weaviate, Qdrant und Neo4j Vector Index.

Die Tools sind Implementierungen der Suchschicht; das Konzept bleibt Similarity Search über Embeddings.

Nächste Schritte

Nächstes Konzept: Knowledge Graphs

Verwandte Themen

Konzepte

RAGHybrid Retrieval

Tools & Plattformen

WeaviateQdrantPineconeMilvuspgvectorNeo4j

Quellen und Ressourcen

Neo4j Vector IndexesFAISS GitHubpgvector GitHub