Embeddings

Simpele Uitleg

Embeddings zijn hoe AI begrijpt dat woorden op elkaar lijken. Het zet tekst om in getallen, waarbij vergelijkbare betekenissen dichtbij elkaar komen. Denk aan GPS coördinaten: "hond" en "puppy" krijgen coördinaten die dicht bij elkaar liggen, "hond" en "auto" liggen ver uit elkaar. Hierdoor kan AI zoeken op betekenis ipv alleen letterlijke woorden. Je zoekt "laptop repareren" en AI vindt ook "notebook herstellen" - want de betekenis is hetzelfde.

Technische Definitie

Embeddings zetten tekst om in getallen (vectoren), waarbij vergelijkbare betekenissen vergelijkbare getallen krijgen. Een model (zoals OpenAI embeddings) is getraind om te herkennen welke woorden op elkaar lijken, en geeft die vergelijkbare posities in een getallenruimte. Zoeken werkt door te vergelijken: welke opgeslagen teksten hebben de meest vergelijkbare getallen als je zoekvraag? Die zijn het meest relevant.

Waarom Dit Belangrijk Is

Zonder embeddings kan AI alleen zoeken op exacte woorden. Met embeddings begrijpt AI betekenis. Je zoekt "laptop repareren" maar je document zegt "notebook herstellen" - gewone zoeken vindt dit niet, embeddings wel. Of je klant vraagt "wifi doet het niet" en je handleiding heet "internetverbinding oplossen" - embeddings snappen dat dit hetzelfde is. Het werkt zelfs tussen talen: zoek in het Nederlands, vind Engelse documenten die passen. Dit is waarom elk modern AI systeem (chatbots, RAG, zoekfuncties) embeddings gebruikt.

Hoe Het Werkt

Stel je voor: elk woord krijgt een plek op een kaart. Woorden die op elkaar lijken staan dicht bij elkaar. "Hond" en "puppy" staan dichtbij "Hond" en "auto" staan ver uit elkaar Als je zoekt naar "jong hondje" kijkt AI: wat staat het dichtst bij? Dat is "puppy". Praktisch: Je stuurt je documenten naar een dienst (zoals OpenAI). Die maakt er getallen van. Die sla je op. Later zoekt iemand iets. Die zoekvraag wordt ook getallen. AI vergelijkt: welke documenten lijken het meest? Die geef je aan AI, en AI kan antwoorden met de juiste informatie.

Praktische Toepassingen

Klantenservice chatbot

Je hebt honderden hulpartikelen. Een klant vraagt "ik heb nog geen geld teruggekregen". AI vindt ook artikelen over "terugbetaling vertraging" en "restitutie problemen" - ook al staan die exacte woorden er niet in. Resultaat: de chatbot geeft veel vaker het juiste antwoord.

Vergelijkbare artikelen vinden

Op je blog leest iemand over AI in marketing. Onderaan zie je "vergelijkbare artikelen" - die worden gevonden met embeddings, omdat ze over hetzelfde onderwerp gaan, zelfs als ze andere woorden gebruiken.

Dubbele vragen herkennen

Je support krijgt veel dezelfde vragen. Embeddings herkennen: "deze vraag lijkt sterk op vraag 127" en kunnen automatisch hetzelfde antwoord geven of vragen samenvoegen.

Veelgemaakte Fouten

Fout:

Denken dat je embeddings moet "begrijpen"

Realiteit:

Je hoeft het niet te begrijpen om het te gebruiken. Moderne diensten regelen alles automatisch. Het is net als Google Maps gebruiken - je hoeft niet te weten hoe GPS werkt.

Fout:

Te ingewikkeld maken

Realiteit:

Voor de meeste bedrijven is het simpel: stuur je teksten naar een dienst, die maakt er getallen van, en je bent klaar. De techniek erachter doet de dienst voor je.

Tools Die Dit Gebruiken

OpenAI Embeddings APICohere EmbedSentence TransformersPineconeWeaviate

Veelgestelde Vragen

Is dit moeilijk om te gebruiken?

Nee. De meeste bedrijven gebruiken diensten zoals OpenAI die het automatisch doen. Jij stuurt tekst, krijgt getallen terug, klaar.

Wat kost het?

Spotgoedkoop. Voor een paar honderd documenten betaal je eenmalig minder dan een euro. Daarna per zoekopdracht een paar cent.

Moet ik programmeren kunnen?

Handig, maar niet nodig. Er zijn tools die embeddings gebruiken zonder dat je code hoeft te schrijven.

Werkt dit ook in het Nederlands?

Ja. Moderne embeddings werken in tientallen talen, inclusief Nederlands.

Gerelateerde Termen

RAG

RAG is de techniek waarmee je AI toegang geeft tot jouw eigen documenten en data. In plaats van dat ChatGPT alleen maar "gokt" op basis van wat het geleerd heeft, kan het met RAG eerst jouw bedrijfsdocumenten doorzoeken en dan antwoorden met échte informatie uit jouw bestanden. Het is als een super-slimme medewerker die instant alle bedrijfsdocumenten kan raadplegen voordat hij antwoordt.

Vector Database

Een vector database slaat embeddings op en zoekt snel naar de meest vergelijkbare vectors. Essentieel voor RAG en semantic search op grote datasets.

Semantic Search

Semantic Search zoekt op betekenis in plaats van exacte woorden. "Smartphone reparatie" vindt ook "iPhone fix guide" omdat de betekenis overeenkomt.

LLM

Een LLM (Large Language Model) is een AI systeem dat getraind is op enorme hoeveelheden tekst en daardoor menselijke taal kan begrijpen en genereren. Denk aan ChatGPT, Claude, of Gemini.

API

Een API is de "telefoonlijn" waarmee software met andere software praat. In plaats van ChatGPT te gebruiken via hun website (typen, copy-pasten), kun je via een API direct vanuit jouw eigen tools vragen sturen en antwoorden ontvangen. Denk aan een restaurant: website = je komt zelf eten, API = bezorgdienst die het eten naar je brengt. Dit is hoe bedrijven AI écht gebruiken - geïntegreerd in hun eigen systemen ipv handmatig via een chatvenster.

Leer Embeddings in de Praktijk

Wil je Embeddings echt beheersen? Volg onze hands-on training en leer het in 4 uur.

Bekijk Trainingen