Informatie is als de liefde, je moet er iets mee doen, want anders verliest het z’n waarde Maarten Marx, UvA beeld: flickr Dit is voor gebruikers van een zoekmachine lastig. Het is nogal een verschil als de zoekmachine je na een zoekvraag naar een mailtje verwijst of naar een enorm bestand met honderden mails, vergaderstukken, kaarten, en wat al meer. Dan mag je het zelf verder uitzoeken in een PDF-lezer. Als je dan ook nog niet eens met Control F in dat bestand kunt zoeken (wat dus voor bijna een derde van de pagina’s het geval is) wordt iets terugvinden een best frustrerende bezigheid. De tekst leesbaar maken kunnen computers nu al best goed. Het weer opknippen is veel lastiger.” Afstudeerders van Marx en Kamps probeerden dat met neurale deep learning AI-technieken. “Voor een mens is het redelijk gemakkelijk om de grens te vinden van een document, maar voor een computer is dat lastiger. We leren dat aan de computer door duizenden dossiers die wel opgeknipt zijn als voorbeelden te geven. Dit werkt aardig goed, maar zeker nog niet foutloos.” Als proof of concept, en om gemeenten en provincies te overtuigen zich aan te sluiten, bouwde de groep van Marx en Kamps een zoekmachine en verwijsindex voor Woo-dossiers: Woogle. Dat bevat momenteel zo’n 7.000 dossiers en meer dan een miljoen pagina’s van allerlei soorten aanbieders. Uitbreiding naar de zestien andere in de Woo genoemde informatie categorieën staat op stapel. Elk document heeft hier een unieke permanente naam, gebaseerd op het bestuursorgaan dat het publiceerde, de soort informatiecategorie en het moment van publiceren. Een voorbeeld van een keurig machine leesbaar dossier vrijgegeven door de gemeente Waalwijk staat op data.wooverheid.nl/gm0867/publications/2022/ nl.gm0867.2022.2i.4/nl.gm0867.2022.2i.4-inhoud.zip. Informatie als grondstof Marx wijst graag op het enorme potentieel aan opbrengsten wanneer Woo-dossiers voor hergebruik beschikbaar zijn. “Dit kan bijdragen aan een betere informatievoorziening van de overheid. Ik wil ambtenaren ervan overtuigen dat ze zeer waardevolle informatie in handen hebben en van het Nummer 45, januari 2023 belang dat anderen die informatie kunnen hergebruiken. We groeien als samenleving als de overheid informatie beschikbaar stelt.” Marx geeft als voorbeeld Google Translate; dat had nooit bestaan zonder netjes vrijgegeven overheidsinformatie. “Machine learning werkt op basis van voorbeelden. Voor Google Translate waren dat de notulen en wetten van het Europees parlement, simultaan vertaald in alle EU-talen; miljoenen voorbeelden van zinnetjes in verschillende talen die precies hetzelfde betekenen. Wie had destijds deze geweldige toepassing kunnen voorzien?” Marx citeert tot slot een uitspraak van zijn promotor: Informatie is de enige grondstof die groeit in het gebruik. Waarom dat zo’n goed motto is? “Informatie is als de liefde, je moet er iets mee doen, want anders verliest het z’n waarde. Anders dan kolen of gas kun je informatie niet opgebruiken; door informatie te combineren ontstaat nieuwe informatie.” API Eind 2022 komt er een API beschikbaar waarmee zaaksysteembeheerders als Visma, Babs en Notubiz Woo-dossiers direct en automatisch in de Woogle zoekmachine kunnen plaatsen. Daarmee vervult Woogle in zekere zin een vergelijkbare rol die de Woo toedacht aan het Platform Open OverheidsInformatie PLOOI. Het onderzoek van Marx en Kamps over de Wet open overheid is te volgen op hun blog wooverheid.nl Eind 2022 werd overigens bekend dat op aanbeveling van het Adviescollege ICT-toetsing de stekker uit de huidige versie van PLOOI wordt getrokken. Belangrijkste reden: verkeerde keuzes in de ICT-ontwikkeling. 37
38 Online Touch Home