Martijn Wieling (tweede van links) met het team van Van Old noar Jong en het Spraaklab. Foto: Martijn Wieling

In de serie Taalonderzoekers stellen we onderzoekers aan u voor die zich aan de Rijksuniversiteit Groningen met het Gronings en het Nedersaksisch bezighouden. Deze week: bijzonder hoogleraar Nedersaksische/Groningse taal en cultuur prof. dr. Martijn Wieling.

Door: Hedwig Sekeres

Dialectometrie
Martijn is zijn carrière in de dialectologie niet begonnen via de studie taalkunde of een moderne taal, maar via de opleiding informatica. Voor zijn afstudeeronderzoek heeft hij gekeken naar het kwantitatief vergelijken van dialecten: dat wil zeggen dat hij de verschillen tussen dialecten uitdrukt in getallen in plaats van in beschrijvingen. Door een grote Nederlandse dataset met honderden woorden en plaatsen te bestuderen probeerde hij patronen in de variatie te ontdekken. Deze tak van de dialectologie wordt ook wel dialectometrie genoemd.

Tijdens zijn promotietraject aan de Rijksuniversiteit Groningen heeft Martijn vervolgens verschillende methoden ontwikkeld om in meer detail te kunnen kijken naar de variatiepatronen. Met deze technieken keek hij niet alleen naar de patronen zelf, maar onderzocht hij ook wat binnen deze patronen de rol is van individuele woorden en welke woorden kenmerkend zijn voor een bepaald dialect. Ook keek hij naar de invloed van sociale en demografische kenmerken op dialectvariatie, zoals het verschil tussen mannen en vrouwen en het verschil tussen kleine dorpen en grote steden.

Na zijn promotie heeft Martijn een jaar in Duitsland aan de universiteit van Tübingen gewerkt aan een nieuwe techniek om dialectvariatie te bestuderen, namelijk door het registreren van tongbewegingen tijdens spraak. Door sensoren op mensen hun tongen te plakken kon hij kleine verschillen in articulatie vinden tussen mensen uit Ter Apel en Ubbergen (zie bijvoorbeeld www.martijnwieling.nl/strip).

Huidige projecten
Op dit moment is Martijn aan de slag met het project Van Old noar Jong, waarvoor een onderwijsapp voor basisscholen ontwikkeld wordt. Met deze app kunnen kinderen kennis maken met het Gronings en leren ze het mogelijk zelfs een beetje spreken. In samenwerking met de Scholierenacademie van de Rijksuniversiteit Groningen ontwikkelen Martijn en zijn team een tienweeks lesprogramma dat in combinatie met de app gebruikt kan worden.

Daarnaast is er recentelijk een project opgestart in samenwerking met het CIT van de Rijksuniversiteit Groningen waarbij er een tekst-naar-spraaksysteem wordt ontwikkeld voor verschillende regionale varianten van het Gronings. Dit systeem zet geschreven tekst automatisch om naar vrij natuurlijk klinkende spraak, zoals hier al te beluisteren is. Prof. dr. Jenny van Doorn, hoogleraar dienstenmarketing aan de Faculteit Economie en Bedrijfskunde van de Rijksuniversiteit Groningen, doet in samenwerking met Martijn onderzoek naar de inzet van dit soort systemen bij robots. Zouden bewoners van een zorgcentrum het bijvoorbeeld fijn vinden om Gronings te kunnen praten met een robot? Of hebben mensen een andere ervaring wanneer een robot dialect spreekt dan wanneer die robot Nederlands spreekt? Ook kan het systeem ingezet worden om in WoordWaark teksten voor te laten lezen in de verschillende varianten.

Tekst-naar-spraak
Maatschappelijk gezien zijn dit soort projecten volgens Martijn belangrijk, omdat immaterieel cultureel erfgoed via een tekst-naar-spraaksysteem op een toegankelijke manier beschikbaar wordt gemaakt. Maar ook wetenschappelijk is het project interessant: omdat er voor het Gronings niet veel spraakmateriaal beschikbaar is, wordt er bij de ontwikkeling van het systeem gebruik gemaakt van het Engels, waar wel grote hoeveelheden gegevens voor beschikbaar zijn. Pas in een later stadium wordt het systeem omgezet naar het Gronings. Een open vraag hierbij is wat de minimale hoeveelheid spraakmateriaal is waarbij het systeem nog goed werkt.

Hoewel het tekst-naar-spraaksysteem tot nu toe goed lijkt te werken, waarschuwt Martijn er ook voor dat we niet te optimistisch moeten zijn. Wanneer een systeem dat getraind is op proza bijvoorbeeld ingezet wordt om poëzie voor te dragen, zal je vaak zien dat het niet natuurlijk klinkt. Omdat het systeem op zoveel mogelijk situaties toepasbaar moet zijn, wordt het namelijk zo algemeen mogelijk gemaakt. Aan de andere kant betekent dit dus dat het voor precieze en specialistische klussen minder goed in te zetten is.

Martijn voorspelt dat deze tekst-naar-spraaksystemen in de toekomst alleen maar beter zullen worden. Wanneer ze bijvoorbeeld geïntegreerd worden in de website van WoordWaark, kunnen mensen het bijvoorbeeld aangeven wanneer er iets niet klopt. Het systeem leert daar vervolgens van, waardoor het steeds minder fouten gaat maken. Dit eerste Groningse tekst-naar-spraaksysteem ziet Martijn dan ook meer als een beginpunt dan als een afgerond product: het kan namelijk altijd beter.

De toekomst van tekst-naar-spraak
Kunnen we dus binnenkort Gronings praten met Google of Siri? Dat is volgens Martijn nog niet zo eenvoudig. Om een systeem te ontwikkelen dat echt kan begrijpen wat iemand zegt en terug kan praten zijn er nog veel meer gegevens nodig dan we nu beschikbaar hebben. Zelfs voor talen waar wel veel gegevens voor zijn, zoals voor het Engels, werken deze systemen nog lang niet perfect. Voor het Gronings of het Nedersaksisch in het geheel zouden er dus nog heel wat dingen moeten gebeuren voordat zoiets mogelijk is. Maar ook hier geldt dat er meer mogelijk is door bestaande modellen voor andere talen aan te passen op het Gronings dan door alles volledig opnieuw op te bouwen.

Spraaklab
Om meer gegevens te kunnen verzamelen voor het tekst-naar-spraaksysteem hoopt Martijn dat hij binnenkort met het nieuwe mobiele laboratorium, Spraaklab, de provincie in kan trekken. Met Spraaklab wordt de wetenschap onder de mensen gebracht en wordt duidelijk zichtbaar waar de onderzoekers zich mee bezig houden. Martijn vindt het erg belangrijk dat de wetenschap niet in afzondering van de samenleving plaatsvindt, maar er deel van is. Wetenschappers moeten daarom ook hun best doen om aan de gemeenschap te laten zien welke interessante dingen ze doen en wat de resultaten van onderzoek kunnen betekenen voor de mensen.