Stop met selecteren, bewaar alles

Op 21 juni was Wietske bij het AVA_Net symposium. Deze keer geen verslag, maar een stuk met een meer filosofische insteek. Want als alles al big data is en we alles moeten archiveren voor de eeuwigheid, wat heeft dat dan voor consequenties?

Volgens keynotespreker Titia van der Werf is de meer analoge benadering van selectie niet meer afdoende. Even gechargeerd: met de huidige technologische ontwikkelingen moeten we niet meer zoveel tijd besteden aan selectie. In plaats daarvan moeten we het liefst alles, en anders zoveel mogelijk, opslaan en bewaren en het aan de toekomstige generaties overlaten om deze te ontsluiten. Ik werd erg geprikkeld door deze en andere uitspraken tijdens de dag en heb hier de afgelopen dagen nog verder over nagedacht. Wat betekent dat dan: alles bewaren voor de eeuwigheid?

Keynote Titia van der Werf. Foto: Sebastiaan ter Burg, CC-BY-2.0

Alles is big data

Waarom is het vraagstuk van selectie nu zo relevant? Eppo van Nispen tot Sevenaar liet dit prachtig zien aan de hand van een aantal voorbeelden. De belangrijkste ontwikkelingen op een rij:

  • Big data is geen apart ‘ding’ meer: er is zoveel data, alles is al big data.
  • Digitaal en fysiek zijn geen afzonderlijke werelden, maar worden door nieuwe generaties als één geheel ervaren.
  • Connectie is de nieuwe collectie. De interactie van gebruikers vormt je toekomstige collectie.
  • Andere platforms, technologieën en manieren van opslag hebben invloed op je archief

Voor instellingen kan dit nog voelen als een ver-van-ons-bed-show. We zijn immers nog druk met het digitaliseren van analoog materiaal en het gedigitaliseerde materiaal beschikbaar stellen. Daarbij is selectie een belangrijke activiteit: wat bewaren we wel en wat niet? Wat gaan we wel digitaliseren en moeten we wel alles digitaliseren? Uit de verschillende ontwikkelingen die werden geschetst, blijkt dat het born-digital domein echt iets anders is en dat we op zoek moeten naar andere selectiemethodes of die zelfs volgens Van der Werf helemaal los moeten laten. Alles (of zoveel mogelijk) bewaren voor de toekomst dus. Voor mij schuurde dat in eerste instantie: tijdens de lezing van Titia van der Werf zag ik dat archief van de toekomst voor me. Een soort serverpark-achtige omgeving met een enorme hoeveelheid aan data die maar blijft groeien, maar waarvan niemand meer weet wat het is en wat je ermee kunt. Obscure formaten en onbekende structuren. Alles is er, maar tegelijk ook niets. Wellicht is dit beeld totaal niet het beeld van het toekomstige archief dat Van der Werf voor ogen heeft en zo dystopisch hoeft het ook helemaal niet te zijn. In ieder geval denk ik dat het belangrijk is om de kwesties rondom selectie en toegang tot archieven vooral niet pas aan de volgende generaties over te laten, maar er toch nu al over na te denken.

Eppo van Nispen tot Sevenaer. Foto: Sebastiaan ter Burg, CC-BY-2.0

De maatschappij, dat zijn wij

Erfgoedinstellingen en culturele bewaarplaatsen zijn onderdeel van de samenleving. Bewaren en ontsluiten doen we niet alleen voor de toekomst, ook de huidige maatschappij is onze klant. Daarom moeten we nu al nadenken over hoe we omgaan met de weerslag van de huidige technologische ontwikkelingen. Dit gaat verder dan webarchivering en het leegtrekken van YouTube. Als we van collectie naar connectie gaan, wat bewaren we dan eigenlijk? Over welke processen hebben we het dan? Hoe zien we de versmelting tussen fysiek en digitaal terug in het bewaren en ontsluiten? Kortom: wat is “alles” en wat ontsluiten we voor wie, wanneer?

Eén waarheid?

Door alles te bewaren, ondervang je het probleem dat informatie die nu niet relevant lijkt weer verdwijnt, terwijl er in de toekomst wel behoefte is aan die informatie. Verschillende perspectieven worden vastgelegd en bewaard. Culturele instellingen krijgen vaak het verwijt een te eenzijdige, West-Europese blik op de geschiedenis en maatschappij te geven (zie bijvoorbeeld dit item). Door alles te bewaren, kun je die gelaagdheid wel tonen en meer recht doen aan die verschillende uitgangspunten zonder censuur te plegen.

Tegelijk proefde ik in de lezing van Van der Werf en al helemaal in die van Melanie Peters een soort sentiment waarin archieven bewaarplaatsen zijn van de waarheid als tegenhanger van nepnieuws. Dit veronderstelt wel een stevig selectiemechanisme waarin waarheid van onwaarheid wordt gescheiden, wat juist niet goed past bij het idee van alles bewaren en meerdere gezichtspunten tonen. Welk perspectief neem je dan als uitgangspunt? Niet alles is even zwart-wit. Nepnieuws is ook een maatschappelijk fenomeen en dat zou je ook als zodanig willen kunnen bewaren. Interpretatie van dit soort informatie vraagt om bepaalde vaardigheden. Zijn die wel aanwezig bij de volgende generaties? Maakt dat wat uit? (Interessant uitstapje: José van Dijck (2018): Vertrouwen in expertise in een digitale samenleving, zie download hieronder) Moeten culturele instellingen bijdragen aan het ontwikkelen van deze vaardigheden? En hoe dan?

Download Created with Sketch.
Jaarrede 2018: Vertrouwen in expertise in een digitale samenleving

Paneldiscussie over de staat van AV-archivering in Nederland met Harry Romijn (Groninger Archieven), Maurits van der Graaf (Pleiade), Maaike Verberk (DEN), Jean-Pierre Sens (Picturae). Foto: Sebastiaan ter Burg, CC-BY-2.0

Kunstmatige intelligentie als oplossing

Interpretatie van data wordt bovendien al lang niet meer alleen door mensen gedaan, maar door zelflerende algoritmes. Tijdens de sessie AI in het digitale archief en tijdens de lightning talks kregen we daar al een aantal mooie voorbeelden van te zien. Zo kun je bijvoorbeeld gezichtsherkenning of spraakherkenning gebruiken om je collecties te laten beschrijven en doorzoekbaar te maken. Voor het maken van nieuw materiaal zijn mensen ook niet meer nodig: de robot-filmmaker Jan Bot maakt op basis van het nieuws en fragmenten uit de collectie van EYE elke dag zelf een nieuw filmpje.

Als archieven nu al big-data archieven zijn, dan vraagt dat om een andere manier van ontsluiten. Zelflerende algoritmes lijken dan het antwoord op de vraag hoe je je weg kunt vinden door het groeiende datawoud. Voor een deel is dat ook zo. We moeten alleen niet vergeten dat zelflerende algoritmes wel door mensen worden gemaakt en dat daar dus bepaalde veronderstellingen aan ten grondslag liggen. Daarnaast zien we dat het aanbod steeds eenzijdiger wordt naarmate we meer gebruik maken van dit soort algoritmes en ze daarmee trainen. Als gebruiker heb je bovendien geen zicht op wat dat algoritme doet en welke veronderstellingen er worden gebruikt. Hoe ga je daar als instelling mee om als je dit soort technologie inzet? Hoe kun je ervoor zorgen dat gebruikers wel de juiste informatie krijgen, zonder een eenzijdig beeld te creëren? In hoeverre laat je je publiek zelf dit soort algoritmes manipuleren?

Tim den Uyl over AI in het digitale archief. Foto: Sebastiaan ter Burg, CC-BY-2.0

De toekomst is nu

Als we alles gaan bewaren, moeten we niet alleen naar de maatschappelijke aspecten kijken, maar ook naar de economische en ecologische aspecten. Tijdens de presentaties kwam dit wel enigszins aan de orde, maar eigenlijk weten we hier nog te weinig van. Welke investeringen vraagt deze aanpak en welke ecologische voetafdruk laat onze verzamelwoede achter? Dit zijn wat mij betreft zeer relevante vragen die de komende tijd eigenlijk ook geadresseerd moeten worden. Wellicht is dat iets voor het volgende AVA_net symposium.

Het symposium heeft me in ieder geval weer eens flink aan het denken gezet. Dat heeft vooral een blog met veel vraagtekens opgeleverd. Anders dan Van der Werf zou ik het beantwoorden van die vragen niet willen doorschuiven naar volgende generaties, maar nu al een begin willen maken met de antwoorden. De toekomst is nu en we staan er wat mij betreft al middenin.

Lees het verslag, bekijk de keynotes en de foto's van het symposium.

Auteur: Wietske van den Heuvel

Adviseur

Neem contact op met Wietske:


070 314 07 62
Thema's
Deel dit artikel