AI Basis

Wat is trainingsdata?

Trainingsdata is de data waarmee een AI-model leert. Voor LLMs is dat tekst: boeken, websites, artikelen, code, conversaties. Het model leert patronen uit die data en kan daardoor nieuwe tekst produceren die lijkt op wat het heeft gezien. De kwaliteit van de trainingsdata bepaalt de kwaliteit van het model. Rommel erin, rommel eruit. Dat is ook waarom sommige modellen beter zijn in bepaalde talen of onderwerpen: ze hebben meer kwalitatieve trainingsdata in die richting. Voor jouw bedrijf hoef je geen trainingsdata aan te leveren. Je gebruikt bestaande modellen die al getraind zijn. Wat je wel kunt doen is het model voorzien van jouw bedrijfsspecifieke context (via RAG of system prompts) zodat het antwoorden geeft die passen bij jouw situatie. Dat is geen training, maar contextualisering.