Martijn Bartelds promoveerde afgelopen november in het Academiegebouw van de Rijksuniversiteit als eerste promovendus vanuit het CGTC. Hij verdedigde zijn proefschrift cum laude. De leden van de beoordelingscommissie en promoter Martijn Wieling waren lovend over Martijn. En hoe breng je dat beter onder woorden dan: ‘kon minder!’ Ook Martijn Bartelds zelf straalde: ‘Ik heb er extreem van genoten.’
Door: Sisi van Halsema
De afgelopen vier jaar wijdde Martijn aan het ontwikkelen van verschillende computermodellen voor talen. ‘De laatste jaren zijn grote computationele taalmodellen heel erg in opkomst,’ vertelt Martijn. Denk bijvoorbeeld aan Alexa of aan ChatGPT. ‘Zulke modellen worden getraind op grote hoeveelheden data van een taal om zo de structuur van deze taal te leren. Je kan daarvoor tekst gebruiken, maar ook – zoals in ons geval– spraakdata.’
Grote computationele taalmodellen werken vaak goed voor grote talen, zoals voor het Engels. Maar voor kleinere talen, bijvoorbeeld minderheidstalen, werken de programma’s veel minder goed. Dat komt omdat er veel minder spraakmateriaal van kleinere talen beschikbaar is. Tijdens zijn PhD onderzocht Martijn hoe je die grote taalmodellen zo kan aanpassen dat ze ook voor kleinere talen als het Gronings gebruikt kunnen worden.
Taalvariatie
Het onderzoek van Martijn heeft twee hoofdlijnen: de eerste gaat over dialectometrie, het gebied van taalkunde dat verschillen tussen taalvarianten meet, of eigenlijk: de afstand tussen talen. Martijn bekeek hoe taalmodellen ingezet kunnen worden om taalvariatie op automatische manier in kaart te brengen.
Voorheen was het in kaart brengen van taalvariatie een tijdrovende klus. Hiervoor moesten namelijk audio-opnames getranscribeerd worden in fonetisch schrift. Het taalmodel van Martijn kan kaarten genereren die behoorlijk accuraat de spraakverschillen in Nederland visualiseren. ‘We hadden zes seconden aan spraak voor ongeveer honderd plaatsen in Nederland. Dat is erg weinig. En toch weet het model de grote verschillen uit elkaar te halen, tussen bijvoorbeeld Limburgs, Fries en Nedersaksisch.’ Maar het programma kan ook kleinere spraakverschillen onderscheiden, tussen bijvoorbeeld de stad Groningen en ‘t Hogeland.
Groningse Google Assistent
Het tweede deel gaat over het ontwikkelen van spraaktechnologie, bijvoorbeeld spraakherkenning. Dat betekent dat het computerprogramma spraak kan omzetten in tekst. ‘Google, wat eten wie vanoamd?’ Wilde je altijd al in het Gronings je telefoon bedienen? Hoewel dat voorlopig nog toekomstmuziek is, brengt het onderzoek van Martijn de optie van een Groningse Google Assistent dichterbij.
‘Een systeem dat audio kan omzetten naar tekst, dat hadden we voor het Gronings niet’, legt Martijn uit. ‘In mijn proefschrift laat ik zien dat we een heel eind kunnen komen: ongeveer 70% van het Gronings kan het programma goed herkennen.’
Deep learning
Aan dit soort computermodellen komt deep learning te pas: een vorm van kunstmatige intelligentie waarbij computers patronen leren herkennen. Maar voor deep learning is enorm veel data nodig. Die data gebruikt de computer namelijk om te toetsen of hij de patronen goed herkent. Zo past het model zichzelf steeds verder aan: het leert van de data.
Uitdaging
De grote uitdaging was dat er heel weinig Groningse spraak beschikbaar is. ‘Daar hebben we een paar trucs voor bedacht, waardoor we kleine hoeveelheden van het Gronings kunstmatig kunnen vermeerderen.’
‘Als je vier uur hebt aan Groningse spraak, dan kan het computerprogramma daar zelf meer van maken. We hebben aangetoond dat dat effectief is om de kwaliteit van de spraakherkenning te verbeteren,’ legt Martijn uit. ‘Dus je begint met het grote taalmodel, dat gewend is aan talen als Engels, Nederlands en Duits. Dan pak je de beschikbare data in het Gronings, en je probeert alle informatie die dat model ooit heeft gezien te gebruiken om zelf Gronings aan te leren.
Maatschappelijk impact
Wat Martijn zelf zo mooi vindt aan dit proefschrift, is dat dit academisch onderzoek makkelijk te vertalen is naar maatschappelijke impact. Zijn onderzoek kan echt iets betekenen voor sprekers van minderheidstalen of dialecten, bijvoorbeeld op het gebied van onderwijs.
Hoe dan? ‘Voor veel talen bestaat er bijvoorbeeld wel materiaal in archieven. Sommige mensen zijn op zoek naar lesprogramma’s om talen nieuw leven in te blazen. Maar die archieven zijn vaak niet geïndexeerd. Je kunt er dan weinig mee: je moet alles luisteren of handmatig doorzoeken.’ Als onderdeel van zijn proefschrift ontwikkelde Martijn met zijn collega’s een audiozoeksysteem. ‘Zo kun je door een woord uit te spreken de hele collectie gesproken materiaal doorzoeken op dat woord. Deze techniek kun je gebruiken om dat soort materiaal doorzoekbaar te maken.’
Verdediging
En die donderdag kwam al dit harde werk van de laatste vier jaar samen tijdens de verdediging van zijn proefschrift. ‘Ik had wel zenuwen, zeker ook de dagen ervoor. Maar eenmaal daar zit je in een soort focusmodus. De hele drie kwartier duurde voor mijn gevoel tien minuten.’
Na de woorden ‘Hora finita’ zat het erop en kreeg Martijn de beoordeling cum laude. ‘Dat raakte mij wel. Tijdens de verdediging doe je gewoon je stinkende best, je probeert alles zo goed mogelijk te pareren. Dus dat was een speciaal moment.’
Inclusieve spraaktechnologie
Nu Martijn zijn PhD heeft afgerond, gaat hij naar Stanford University in de Amerikaanse staat Californië. Daar gaat hij verder met het onderzoeken en ontwikkelen van spraaktechnologie, en voor een deel ook spraakherkenning. ‘Het doel is om het project nog breder te trekken en het toe te passen op verschillende taalfamilies. We willen een nog breder scala aan minderheidstalen en dialecten erbij betrekken.’ Het doel is om toe te werken naar ‘inclusieve spraaktechnologie.’ Veel spraaktechnologie is nu nog vooral gefocust op Indo-Europese talen. Hoe mooi zou het zijn dat je, ongeacht je moedertaal of dialect, toegang hebt tot technologieën.
Martijn werkt ondertussen nog even door. Waarom hij niet op vakantie is na zijn PhD-verdediging? ‘Er ligt nog één project op de plank. Een computermodel dat Groningse tekst kan omzetten in spraak. Dat je een Groningse zin kan intypen en dat die wordt voorgelezen.’ Dit project maakt hij nog af voor zijn vertrek naar de Verenigde Staten.
En niet getreurd, want hoewel Martijn in ieder geval voor de komende twee jaar in de Verenigde Staten woont, zullen ook Nederlandse minderheidstalen een plekje krijgen in het onderzoek naar inclusieve spraaktechnologie.