Nieuws & Updates

Spotlight

Ik besteedde mijn geld om LLM’s te benchmarken op Nederlandse examens – zodat jij dat niet hoeft te doen

In dit blog deel ik mijn ervaringen met het benchmarken van verschillende grote taalmodellen (LLM’s) op basis van Nederlandse staatsexamens. Veel benchmarks richten zich op Engels, waardoor specifieke prestaties in het Nederlands vaak onderbelicht blijven. Ik verzamelde en verwerkte meer dan 12.000 PDF’s met examenvragen om inzicht te krijgen in hoe modellen zoals o1-mini, GPT-4o en Claude-3 presteren op begrijpend lezen en andere Nederlandstalige taken. Het resultaat? o1-mini blijkt beter én goedkoper te presteren dan duurdere modellen. Dit blog biedt waardevolle inzichten voor bedrijven die Nederlandstalige AI-toepassingen willen bouwen of opschalen.

Gebruikt de Tweede Kamer ondanks een ‘verbod’ toch generatieve modellen om te schrijven (of reflecteren ze vaker)?

Gebruikt de Tweede Kamer ondanks een ‘verbod’ toch generatieve modellen om te schrijven (of reflecteren ze vaker)? Generatieve AI is als de uitvinding van het toetsenbord of van de pen: weigeren ermee te leren werken is een goede manier om boventallig te worden. Voor...

Muziek, kunst en (kunst)matige intelligentie

Muziek, kunst en (kunst)matige intelligentie Recentelijk heeft kunstmatige intelligentie (AI) voor opschudding gezorgd in de creatieve wereld, vooral binnen de muziekindustrie. Nieuwe platforms zoals Suno.ai en Udio stellen gebruikers in staat om binnen enkele...

Meer nieuws

Ik besteedde mijn geld om LLM’s te benchmarken op Nederlandse examens – zodat jij dat niet hoeft te doen

Ik besteedde mijn geld om LLM’s te benchmarken op Nederlandse examens – zodat jij dat niet hoeft te doen

In dit blog deel ik mijn ervaringen met het benchmarken van verschillende grote taalmodellen (LLM’s) op basis van Nederlandse staatsexamens. Veel benchmarks richten zich op Engels, waardoor specifieke prestaties in het Nederlands vaak onderbelicht blijven. Ik verzamelde en verwerkte meer dan 12.000 PDF’s met examenvragen om inzicht te krijgen in hoe modellen zoals o1-mini, GPT-4o en Claude-3 presteren op begrijpend lezen en andere Nederlandstalige taken. Het resultaat? o1-mini blijkt beter én goedkoper te presteren dan duurdere modellen. Dit blog biedt waardevolle inzichten voor bedrijven die Nederlandstalige AI-toepassingen willen bouwen of opschalen.

Is social media het nieuwe tabak?

Is social media het nieuwe tabak?

Is social media het nieuwe tabak? In 1930 werd er breed reclame gemaakt voor sigaretten: minder irritatie van de keel, lekker ontspannen en een hulpmiddel tegen hoesten. Nu, bijna 100 jaar later, is het duidelijk: roken veroorzaakt kanker en een breed scala aan...

Moet AI-stemreplicatie verboden worden?

Moet AI-stemreplicatie verboden worden?

Moet AI-stemreplicatie verboden worden? Stemreplicatie is door recente technologische doorbraken eenvoudiger dan ooit. Tijdens de boekpresentatie van “De AI Revolutie” liet ik stemmen horen van Koning Willem Alexander, Burgemeester Femke Halsema en historicus Maarten...