Embedding
Das Modell erzeugt Vektoren
Ein Embedding-Modell übersetzt Text, Bilder oder Objekte in Vektoren. Diese Vektoren repräsentieren Bedeutung, sind aber noch keine schnelle Suchmaschine.
Konzept-Detail
Suchindex für Embeddings, der ähnliche Vektoren schnell auffindbar macht.
Kuratierte Konzeptseite auf Basis der lokalen Compass-Daten
Ein Vektorindex ist die Suchstruktur hinter semantischer Suche. Embeddings sind nur Koordinaten im Vektorraum; der Index sorgt dafür, dass ähnliche Vektoren schnell gefunden werden, auch wenn Millionen von Chunks, Dokumenten oder Objekten durchsucht werden müssen. In großen Beständen passiert das oft über ANN: eine schnelle Näherungssuche, die fast dieselben Treffer findet, aber nicht jeden Vektor exakt vergleicht.
Was der Vektorindex leistet
Embedding
Ein Embedding-Modell übersetzt Text, Bilder oder Objekte in Vektoren. Diese Vektoren repräsentieren Bedeutung, sind aber noch keine schnelle Suchmaschine.
Index
Der Vektorindex organisiert Embeddings für Similarity Search. Approximate Nearest Neighbor, kurz ANN, beschleunigt die Suche, indem nicht der komplette Bestand geprüft wird. Das verbessert Latenz und Kosten, kann aber je nach Einstellung relevante Treffer verpassen.
HNSW
HNSW ist ein verbreitetes ANN-Verfahren. Es organisiert Vektoren wie ein mehrstufiges Nachbarschaftsnetz: Die Suche startet grob, springt von Knoten zu Knoten näher an den Zielbereich und prüft am Ende nur noch gute Kandidaten statt den ganzen Bestand.
Retrieval
Die Suche liefert die ähnlichsten Kandidaten. Top-k, Metadatenfilter, Schwellenwerte und spätere Reranker entscheiden, was am Ende wirklich in das Kontextpaket kommt.
Ein Vektorindex ist die Basis für RAG, semantische Suche und viele Hybrid-Retrieval-Stacks. Er ist kein Knowledge Graph, aber oft die erste Baseline, gegen die GraphRAG seinen Mehrwert zeigen muss.
Ein guter Start ist ein kleiner Index mit repräsentativen Chunks, Metadatenfiltern und Golden Questions. Danach misst man Recall@k, prüft falsche ähnliche Treffer und entscheidet, ob ANN-Parameter, Top-k, Hybrid Retrieval oder Graphkontext angepasst werden müssen.
Die Beispiele zeigen den Vektorindex als Retrieval-Baustein zwischen Embedding-Modell, Vektordatenbank und GraphRAG-Architektur.
Ein Dokumentbestand wächst von tausend auf mehrere Millionen Textabschnitte.
ANN macht Similarity Search schnell genug, weil nicht jeder Vektor vollständig mit der Anfrage verglichen werden muss.
Ein Team sieht in einer Vektordatenbank Einstellungen wie HNSW, efSearch oder M und will wissen, warum das Retrieval dadurch schneller oder genauer wird.
HNSW ist ein ANN-Verfahren: ein mehrstufiges Nachbarschaftsnetz, das die Suche Schritt für Schritt in Richtung ähnlicher Kandidaten führt.
Golden Questions haben erwartete Quellen, aber relevante Chunks erscheinen nicht unter den ersten Treffern.
Top-k, Filter und ANN-Einstellungen werden als Retrieval-Qualität sichtbar, nicht als Modellgefühl.
Ein Team vergleicht FAISS, pgvector, Pinecone, Weaviate, Qdrant und Neo4j Vector Index.
Die Tools sind Implementierungen der Suchschicht; das Konzept bleibt Similarity Search über Embeddings.
Nächste Schritte