Embedding
Mathematische Darstellung von Text (oder anderen Daten) als Vektor im hochdimensionalen Raum — ermöglicht semantische Suche und Ähnlichkeitsvergleiche.
Embedding
Ein Embedding ist eine numerische Repräsentation von Text als Vektor (eine Liste von Zahlen) im hochdimensionalen Raum. Ähnliche Texte liegen im Vektorraum nahe beieinander — unabhängig von exakter Wortübereinstimmung.
Beispiel
„Software entwickeln" und „Code schreiben" haben ähnliche Embeddings, obwohl sie keine gemeinsamen Wörter teilen. Eine Suchanfrage nach „Code schreiben" würde daher auch Texte über „Software entwickeln" finden.
Einsatz
Embeddings sind die Grundlage für RAG-Systeme: Dokumente werden als Embeddings in einer Vektordatenbank gespeichert; Suchanfragen werden ebenfalls zu Embeddings konvertiert, um ähnliche Dokumente zu finden.
Verwandte Begriffe
RAG (Retrieval-Augmented Generation)
Technik, bei der ein LLM vor der Antwortgenerierung relevante Dokumente aus einer Wissensbasis abruft — kombiniert die Stärken von Suche und Sprachgenerierung.
Vektordatenbank
Eine spezialisierte Datenbank zum effizienten Speichern und Suchen von Embeddings — Kernkomponente jedes RAG-Systems.
Large Language Model (LLM)
KI-Modelle, trainiert auf riesigen Textmengen, die Sprache verstehen und generieren können — die Kerntechnologie hinter ChatGPT, Claude und Gemini.