Modellen & Tools

Wat is een embedding?

Een embedding is een manier om tekst om te zetten in getallen zodat een computer de betekenis ervan kan vergelijken. Elk stuk tekst krijgt een reeks getallen (een vector) die de inhoud representeert. Teksten met vergelijkbare betekenis krijgen vergelijkbare vectors, ook als ze compleet andere woorden gebruiken. 'Ik wil een afspraak verzetten' en 'Kan mijn meeting naar een andere dag?' zijn totaal andere zinnen maar krijgen bijna dezelfde embedding. Dat is de kracht: je kunt zoeken op betekenis in plaats van op exacte woorden. Embeddings zijn de technologie achter RAG. Als je een vraag stelt, wordt die omgezet in een embedding en vergeleken met de embeddings van je documenten. De meest relevante documenten worden dan meegegeven aan het AI-model. Je hoeft geen expert te zijn in embeddings. Maar als iemand je vertelt dat je data 'doorzoekbaar' wordt gemaakt voor AI, worden er embeddings gemaakt.

Wat is een embedding?

Meer uit de kennisbank

Wat is een vector database?

Wat is RAG (Retrieval-Augmented Generation)?

Wat is een LLM (Large Language Model)?