CGTC-taalonderzoeker Wietse de Vries verdedigt donderdag 6 juni in het Academiegebouw zijn proefschrift: ‘Evaluation and Adaptation of Neural Language Models for Under-Resourced Languages.’ De afgelopen vier jaar deed Wietse onderzoek naar taalmodellen en hoe deze taalmodellen aangepast kunnen worden voor kleinere talen zoals het Gronings.
Taalmodellen worden steeds meer gebruikt: door wetenschappers, door de industrie, door iedereen die er interesse in heeft. Maar, taalmodellen worden vaak hoofdzakelijk ontwikkeld voor het Engels, terwijl andere talen achterblijven. Het onderzoek van Wietse verkent hoe goed niet-Engelse taalmodellen werken. Daarnaast heeft hij onderzocht hoe taalmodellen die ontworpen zijn voor ‘high-resource languages’ (talen waar meer data van beschikbaar is, zoals het Engels) en hoe deze aangepast kunnen worden naar ‘low-resource languages’ (talen waar minder data van beschikbaar is, zoals het Gronings en het Fries).