Het internet vergeet nooit... Of toch wel?

We publiceren enorm veel informatie op internet. Vaak gaan we er daarbij van uit dat de informatie, als deze eenmaal op internet geplaatst is, altijd beschikbaar zal blijven. Helaas is in de praktijk gebleken dat er zaken zijn die verdwijnen. Ze verdwijnen doordat we zelf dingen weggooien of aanpassen of doordat de platforms en servers content verwijderen of zelfs helemaal verdwijnen. Wil je toch je oude content en websites bewaren, dan kan webarchivering een oplossing zijn. In dit kennisdossier lees je meer over het belang van webarchivering, de verschillende technieken die worden gebruikt en de initiatieven die er op dit gebied zijn.

Het belang van webarchivering

Toegang tot oude websites of oude versies van bestaande websites is relevant voor verschillende doeleinden en doelgroepen:

  • Onderzoekers, juristen en journalisten: webarchivering als middel voor waarheidsvinding en bewijsvoering.
  • Onderzoekers en cultureel erfgoedinstellingen: webarchivering als bron voor sociaal-cultureel onderzoek.
  • Instellingen en organisaties: webarchivering als onderdeel van het bedrijfsarchief en in sommige gevallen is het online archief ook meteen het enige digitale archief.

In het onderstaande filmpje van het Netwerk Digitaal Erfgoed, waar DEN ook deel van uitmaakt, wordt het belang van webarchivering duidelijk uitgelegd.

Wat ga je archiveren?

Webarchivering kent ook beperkingen. Want wanneer archiveer je welke pagina? Anders dan bij een boek of film wordt de inhoud steeds aangepast doordat er nieuwe informatie wordt gepubliceerd of doordat gebruikers reageren op iets wat je hebt gepost. Wil je al deze veranderingen kunnen archiveren, of kies je er voor om op vaste tijden een momentopname te maken?

Hoe complexer een website, hoe lastiger het is om deze te archiveren. Een deel van de informatie staat meestal niet op de website zelf, maar wordt uit andere bronnen gehaald. Filmpjes staan bijvoorbeeld op YouTube en foto’s op Flickr. Bij archivering wordt dan wel de verwijzing opgeslagen, maar niet de externe media zelf. Nog ingewikkelder wordt het wanneer je website (bijna) in zijn geheel bestaat uit informatie uit API’s of Linked Open Data. Dan ben je helemaal afhankelijk van de dataleverancier voor het toegankelijk houden van de data.

Een website kan, afhankelijk van de gebruiker, op verschillende manieren getoond worden. Wat archiveer je dan? Tegenwoordig zijn websites bijna allemaal responsive, wat wil zeggen dat de weergave zich automatisch aanpast aan het apparaat waarmee de website bekeken wordt. In het verleden werd veel gebruikgemaakt van client-side programmeren. In dat geval is de weergave afhankelijk van de browser. Oude websites kunnen bovendien niet altijd meer in de huidige browsers bekeken worden, dus daar zijn ook oplossingen voor nodig.

Aan de slag: zelf doen of via een gezamenlijke oplossing

Als je je website wil archiveren, kun je dat zelf doen of uitbesteden aan een leverancier. In beide gevallen moet je bedenken wat je precies wil bewaren en hoe je dat terug moet kunnen zien. Zelf archiveren vergt wel behoorlijk wat specialistische kennis. Het Nationaal Archief heeft bijvoorbeeld een handreiking webarchivering opgesteld met daarin een aantal uitgangspunten en standaarden. Als je met een leverancier in zee gaat, loont het om de webarchivering samen met andere partijen in te kopen.

Daarnaast wordt in het kader van het Netwerk Digitaal Erfgoed door een aantal partijen samengewerkt om uiteindelijk een gezamenlijke voorziening voor webarchivering te ontwikkelen. Verschillende technieken worden getest en met elkaar vergeleken. In dit filmpje zie je hoe webarchivering in zijn werk gaat en op welke manier er samengewerkt wordt.

Daarnaast wordt ook internationaal aan webarchivering gewerkt. Het bekendste voorbeeld is The Internet Archive met de Way Back Machine.

Oeps… Verdwenen

Niet alleen je eigen site verandert, ook andere platforms die je gebruikt om je doelgroep te bereiken kunnen veranderen en verdwijnen. In dat geval heb je totaal geen controle over wat er wel en niet gearchiveerd wordt. Dit geldt zeker voor sociale media. Het platform Hyves had een miljoenenpubliek en was in Nederland, zeker in het begin, groter dan Facebook. Door allerlei ontwikkelingen werd in 2013 de stekker eruit getrokken. Weg content en weg interactie met de gebruikers. Dit kan ook zomaar gebeuren met andere social media sites. Als online archief is zo’n platform dan ook verre van betrouwbaar.

Webarcheologie

Het kan ook voorkomen dat websites al verdwenen zijn voordat ze zijn gearchiveerd. Soms kun je delen hiervan nog terugvinden in de Way Back Machine, maar in andere gevallen is er vrijwel niets meer te vinden. Webarcheologie kan dan een uitkomst bieden. Een mooi voorbeeld hiervan is het project De Digitale Stad Herleeft, waarin de eerste virtuele gemeenschap van Nederland wordt gereconstrueerd. Naar aanleiding van dit project is ook het DIY handboek voor webarchivering verschenen. Een ander voorbeeld is Meldpunt Prullenbak van J-Lab, waar geïnventariseerd wordt welke journalistieke websites verdwenen zijn.

Wordt mijn site al gearchiveerd?

De kans is groot dat jouw website al ergens op een bepaald moment gearchiveerd is. Door een URL in te voeren bij de Way Back Machine kun je bekijken of jouw website ook meegenomen is in het archief en op welk moment de website is gearchiveerd. Dit zijn wel momentopnames en tussentijdse wijzigingen zijn niet opgeslagen. Daarnaast wordt binnen het Netwerk Digitaal Erfgoed gewerkt aan een Nationaal Register Webarchivering, waarin je kunt zien welke website door welke instelling met welke technologie wordt gearchiveerd. Dit register wordt op termijn online gepubliceerd. Je kunt hier trouwens niet de websites zelf bekijken, maar alleen of een website wordt gearchiveerd. De content van de website is eigenlijk altijd beschermd door het auteursrecht, waardoor je die niet zomaar elders mag publiceren.

Contactpersoon: Wietske van den Heuvel

Adviseur

Neem contact op met Wietske:


070 314 07 62
Deel dit artikel