digitaal / Partnerbijdrage

De “eigenzinnige” documenten van de Woo

Alleen het verzamelen van documenten voor Woo-verzoeken is vaak niet genoeg om documenten goed te kunnen beoordelen.

20 juli 2022
USB-Stick

Veelal moeten de verschillende documenten worden geanalyseerd en op de juiste manier worden verwerkt om deze bruikbaar te maken voor het Woo besluit. Met name als je gebruikt wil maken van meer automatisering om Woo verzoeken te verwerken, dan is het een voordeel als alle documenten zowel individueel als in relatie tot elkaar bijvoorbeeld volledig doorzoekbaar zijn. Dit helpt bij het selecteren van de documenten die onder het verzoek vallen, je kan op de inhoud van het documenten zoeken en daarnaast ook bij de analyse van deze documenten door persoonsnamen en andere gegevens te herkennen.

Vaak zijn documenten die uit het “archief”, zaaksysteem of document managementsysteem direct bruikbaar om te verwerken tot een Woo besluit. Dit zijn dan nette Microsoft Word documenten of PDF-documenten die zelf zijn gemaakt door bijvoorbeeld een e-mail of Microsoft Word document om te zetten naar PDF. Maar het komt met regelmaat voor dat documenten niet altijd geschikt zijn om direct gebruikt te worden. Deze documenten hebben een extra verwerking nodig om ze geschikt en leesbaar te maken.

PDF

PDF is een alom geaccepteerd formaat en wordt veel gebruikt. PDF-documenten kan je zelf makkelijk maken door bijvoorbeeld een Microsoft Word document op te slaan als PDF. Je hebt dan direct een mooie doorzoekbare PDF die iedereen kan lezen. Maar het gebeurt ook vaak genoeg dat PDF documenten van een derde partij komen en dat het op het eerste gezicht niet duidelijk is of dit document wel doorzoekbaar is. Iedereen kent wel nu wel de mogelijkheid om een document te scannen op kantoor en deze vervolgens in de mail te ontvangen. De meeste apparaten die hiervoor gebruikt worden, maken een keurige doorzoekbare PDF. Maar oudere apparaten doen dat vaak niet. Je krijgt dan wel een PDF, maar deze is eigenlijk alleen terug te vinden op de bestandsnaam. De inhoud van deze documenten is niet doorzoekbaar. Door de huidige thuiswerksituatie als gevolg van COVID-19 gebeurt het nu vaker dat documenten even met de telefoon worden “gescand”. Vaak even een foto maken van het document of via een “gratis” documenten scanner app even scannen en doorsturen. Veel van deze documenten zijn niet doorzoekbaar en indien deze worden opgenomen in het “archief” zijn deze moeilijker terug te vinden.

In de praktijk is het wel eens voorgekomen dan documenten zoals contracten met een derde partij, een leverancier van een overheidsinstantie, werden opgenomen in het “archief”. Tijdens een onderzoek naar inkoop en leveranciers werden contracten opgezocht in het “archief” waarbij de desbetreffende documenten van die ene leverancier niet werden gevonden. Op een later moment is dit wel achterhaald door gebruik te maken van de juiste tooling.

Tip: Met de gratis App Microsoft Office Lens maak je makkelijk scans en doorzoekbare PDF documenten.

Embedded (Ingesloten) Objecten en Bijlagen

Tja, wat is de juiste Nederlandse naam hiervoor, een Embedded Object is een bestand dat is ingesloten in een ander bestand. Een voorbeeld is een plaatje in een Microsoft Word document. Dat is daardoor een object in een document geworden. Dit is nog vrij gangbaar en komt vaak voor. Maar het kan ook gebeuren dat er een PDF document wordt ingesloten in een Microsoft Word document. In de praktijk komen wij wel eens bijzondere documenten tegen zoals bijvoorbeeld een Excel sheet van 50MB. Dat is natuurlijk een hele grote Excel sheet, maar in plaats van heel veel cijfers, bevatte deze Excel sheet 40 PDF documenten als bijlagen (ingesloten objecten). De eigenaar van het document gebruikte de Excel om zijn PDF documenten bij elkaar te houden. Erg lastig om dit type documenten direct te verwerken voor een Wob of Woo verzoek, dus ook hiervoor zijn extra bewerkingen nodig. Andere voorbeelden hiervan zijn:

  • Microsoft Word documenten met Microsoft Excel tabellen
  • PDF documenten met bijlages
  • E-mails met plaatjes in de tekst en niet als bijlage

E-mail

Meer en meer zijn het niet alleen de documenten uit het archief tot het Woo besluit behoren, maar met name e-mail maakt een steeds groter deel uit van alle documenten die worden gepubliceerd. Soms tot wel 70% van de informatie komt oorspronkelijk uit e-mail. E-mail heeft natuurlijk bijlages in allerlei variaties. Een e-mail kan bijlages hebben zoals Microsoft Word en PDF, maar bijvoorbeeld ook een RAR of ZIP bestand met daarin allerlei documenten verpakt. De relatie tussen de e-mail en bijlages moet natuurlijk bewaard blijven tijdens de beoordeling en alle verschillende type documenten moeten bekeken kunnen worden. Een geautomatiseerde verwerking waarbij hieraan wordt voldaan kan veel tijd en “gedoe” besparen.

Daarnaast zijn er ook nog de zogenaamde berichtenreeksen of conversaties van opeenvolgende reacties op eerder e-mails. Het inzichtelijk maken hiervan maakt het mogelijk om zo snel te zien welke e-mails volledig zijn en welke niet. Visualisatie van deze berichtenreeksen kan voor de beoordelaars veel tijd schelen.

Al met al is het soms niet makkelijk om even snel een paar documenten te vinden die voldoen aan het Woo verzoek en die meteen verwerkt kunnen worden. Er gaat vaak nog een proces aan vooraf om documenten geschikt te maken voor het beoordelen en verwerken.

Wil je meer hierover weten?
Lees dan ons whitepaper: In 5 stappen naar betere Wob-afhandeling
of kijk ons webinar terug over 'Lakken is topsport'.

Daniel Schuuring
Daniel is Manager e-Discovery en Wob (Dutch FOIA), en lid van het ZyLAB DevOps team.

Plaats als eerste een reactie

U moet ingelogd zijn om een reactie te kunnen plaatsen.