69

brief laten schrijven...? eenvoudig. En we weten inmiddels dat veel (jonge) Nederlanders de geschreven taal slecht beheersen. Is dat een probleem? Lensink: “Inderdaad een belangrijke kwestie. We hebben nog behoefte aan bronnen met gebruik van simpel Nederlands. Immers, er liggen hele mooie use cases voor GPT-NL toepassingen waar Nederland echt iets aan heeft, zoals het vereenvoudigd weergeven van overheidsinformatie.” Selmar Smit en Saskia Lensink, projectleiders GPT-NL bij TNO. expertise en ervaring.” NFI en de politie trainden bijvoorbeeld taalmodel Bert om specifiek taalgebruik in criminele groepen te traceren en doodsbedreigingen te filteren. Echt Nederlands Ook TNO doet al jaren onderzoek naar GenAI en taaltechnologie. We spreken met de projectleiders van GPT-NL bij TNO, Selmar Smit en Saskia Lensink. Hun enthousiasme maakt indruk. Maar dan nog: GPT-NL is toch een kaboutertje van 13 miljoen euro tegenover de Amerikaanse miljarden dollars die superieure toepassingen genereren? Smit: “Wij bouwen voor een nu al bestaande behoefte bij instellingen en universiteiten aan applicaties waar Nederland betrouwbaar mee kan werken en die echt Nederlands produceren. Superieur hoeft niet per se te betekenen dat een taalmodel heel goed is in bijvoorbeeld het schrijven van een Sinterklaasgedicht.” Blijft de vraag wat er specifiek beter is aan een Nederlands model. Lensink: “Probeer eens een sollicitatiebrief te laten schrijven door ChatGPT. Zelfs in het Nederlands klinkt het als Engelse tekst. De openingszin luidt ‘Ik wil mijn geweldig enthousiasme uitdrukken voor deze enorme kans bij dit geweldige bedrijf.’ Een tweede reden is dat je wilt weten hoe zo’n taalmodel wordt opgebouwd en tot uitkomsten komt. Amerikaanse big tech maakt nu voor ons onnavolgbare keuzes.” Anderzijds, Nederland is geen eiland. Zowel criminelen (NFI) als academici en ambtenaren communiceren internationaal in het Engels. Smit: “Goed punt. We willen het taalmodel fifty-fifty met Nederlands en Engels trainen.” Behapbare overheidsinformatie Veel beschikbare taal, zeker in academische kringen, is niet Nummer 49, januari 2024 Kunnen mensen van wie de leesvaardigheid niet volstaat om zich tot de bureaucratie te verhouden straks met hun GPT-NL-assistent vragen: en wat bedoelt u precies? En krijgen ze dan een antwoord dat ze kunnen behappen? Lensink en Smit zouden dat een mooie toepassing vinden, “al helpt die onvoldoende leesvaardigheid niet.” De trainingsdata moeten hoe dan ook een goede afspiegeling zijn van gebruikt Nederlands, inclusief de ‘afwijkende’ taalvariëteiten. Smit: “We voeren momenteel veel gesprekken over de behoeften en formuleren onze wensen. Willen we bijvoorbeeld een model dat goed kan rappen, dan moet je dus wel taal van raps invoeren.” Suggestie: laat GPT-NL de Nederlandse communicatie van Facebook en X leegtrekken om het model breed te trainen met ‘gewonemensentaal’. Smit: “Dat mag niet en bovendien zou je hate speech vervolgens moeten uitfilteren. Dat is een constante afweging.” Experiment Of ook schuttingtaal een plek krijgt, is zo’n afweging. Immers, ‘digitale soevereiniteit’ betekent enerzijds inclusiviteit voor alle Nederlandse taal, anderzijds zouden beledigingen niet mogen. Je vervalt al snel in censuur. Met de DSA-richtlijn straft Europa platforms die niet streng filteren op bijvoorbeeld discriminerende uitingen. Maar waarden onder de van overheidswege ‘goedgekeurde’ modellen balanceren eveneens op een dun koord. Komen de woorden ‘nepparlement’ en ‘knettergek’ en ‘wappie’ in het model? En wat antwoordt het model straks op de vraag: wie is een echte Nederlander? TNO deed een leuk experiment: de Stemwijzer door verschillende Amerikaanse AI-apps laten invullen. Wat bleek? De uitslag was een stuk linkser dan de Nederlandse verkiezingsuitslag, terwijl Amerikanen gemiddeld rechtser zijn. Hoe kwam dat? Vooroordeel in de trainingsdata? Smit: “Dat is precies de vraag die we niet kunnen beantwoorden, omdat we geen enkel inzicht hebben in die Amerikaanse modellen. Dat is nu juist de crux. Met GPT-NL willen we dat wel kunnen traceren, uitleggen en eventueel corrigeren…” 69

70 Online Touch Home


You need flash player to view this online publication