Trainingsdata is de data waarmee een AI-model leert. Voor LLMs is dat tekst: boeken, websites, artikelen, code, conversaties. Het model leert patronen uit die data en kan daardoor nieuwe tekst produceren die lijkt op wat het heeft gezien. De kwaliteit van de trainingsdata bepaalt de kwaliteit van het model. Rommel erin, rommel eruit. Dat is ook waarom sommige modellen beter zijn in bepaalde talen of onderwerpen: ze hebben meer kwalitatieve trainingsdata in die richting. Voor jouw bedrijf hoef je geen trainingsdata aan te leveren. Je gebruikt bestaande modellen die al getraind zijn. Wat je wel kunt doen is het model voorzien van jouw bedrijfsspecifieke context (via RAG of system prompts) zodat het antwoorden geeft die passen bij jouw situatie. Dat is geen training, maar contextualisering.
AI Basis
Wat is trainingsdata?
Meer uit de kennisbank
AI Basis
Wat is machine learning?
Machine learning is een vorm van AI waarbij software leert van data in plaats van geprogrammeerde regels. Je geeft het s...
Lees meer north_east
AI Basis
Wat is een LLM (Large Language Model)?
Een LLM is een AI-model dat getraind is op enorme hoeveelheden tekst en daardoor menselijke taal kan begrijpen en produc...
Lees meer north_east
Modellen & Tools
Wat is fine-tuning?
Fine-tuning is het verder trainen van een bestaand AI-model op jouw specifieke data, zodat het beter wordt in taken die ...
Lees meer north_east