home
ContactOver DENNieuwsAgendaNieuwsbriefWegwijzerPersEnglish


Wat is nodig voor digitalisering: Gestandaardiseerde informatieverwerking (Leidraad Erfgoed Digitaal)
Auteur: DEN / Versie: 1 / Bewerkt: 1
Standaarden en metadata zijn van cruciaal belang voor behoud, beheer en toegankelijkheid van gegevens in een digitaliseringsproject.
Leidraad Erfgoed Digitaal
Hoofdstuk 2 - Wat is nodig voor digitalisering?
Gestandaardiseerde informatieverwerking
Standaarden
Standaarden worden gebruikt om vast te stellen welke informatie moet worden genoteerd om toekomstig beheer, onderhoud, hergebruik en raadpleegbaarheid van digitale data te waarborgen. Gestandaardiseerde informatieverwerking komt zowel binnen een instelling (bij het converteren, bijvoorbeeld wanneer er wordt overgegaan naar een ander informatiesysteem, en bij het combineren van informatie uit verschillende systemen) als tussen samenwerkende instellingen van pas en is bevorderlijk voor de toegankelijkheid en terugvindbaarheid van gegevens via het internet. Wil het digitaliseren van erfgoedcollecties haalbaar zijn, dan moet rekening worden gehouden met de manier waarop en de mate waarin het op te nemen bronmateriaal al beschreven is.
Metadata
Metadata zijn verbonden met standaarden. Metadata kunnen gekarakteriseerd worden als gestructureerde gegevens over gegevens. Metadata worden gebruikt om bronnen te karakteriseren. Zij maken bijvoorbeeld duidelijk in welke context een bron kan worden benut of hoe een bron zich tot een collectie verhoudt. Met dergelijke gestructureerde beschrijvende gegevens kan een instelling haar bronnenmateriaal beter toegankelijk en terugvindbaar maken.
Tijdens het digitaliseren worden metadata toegekend. Dat gebeurt op verschillende momenten. In samenhang daarmee worden metadata ingedeeld in drie groepen: technisch, administratief en beschrijvend. Technische metadata worden toegekend tijdens het digitaliseren, administratieve metadata staan in dienst van het beheer van de collectie.
Beschrijvende metadata kunnen formeel of inhoudelijk van aard zijn. Iedere erfgoedsector kent eigen formele beschrijvingsstandaarden. Deinhoudelijke beschrijvingsstandaardverschilt meestal per soort bron en is ook afhankelijk van het te beschrijven kennisdomein en de doelgroep die de data krijgt aangeboden. Metadata voor behoud en beheer bijvoorbeeld zijn meestal niet geschikt voor een educatief doel.
Bij een gecombineerd informatieaanbod uit verschillende databanken moeten de formele beschrijvingsstandaarden onderling worden vergeleken. Dat geldt zowel binnen een instelling als bij samenwerking tussen instellingen. Deze vergelijking wordt gemaakt in een‘crosswalk’, waarbij men probeert duidelijk te maken welke velden van de verschillende databanksystemen dezelfde soort informatie bevatten.
Dublin Core
Om data gecombineerd te kunnen aanbieden gebruiken instellingen een gemeenschappelijk gestandaardiseerd format. Een veelgebruikt schema is Dublin Core, dat oorspronkelijk werd ontwikkeld om webpagina’s te voorzien van beschrijvende gegevens. Met vijftien voorgeschreven basiselementen kunnen de meest basale gegevens van digitale bron en inhoud worden beschreven om het gestandaardiseerd uitwisselen van gegevens mogelijk te maken.

Het gebruik van Dublin Core leidt meestal door de beperking van het aantal op te nemen gegevens tot informatieverlies. Een organisatie kan ook eigen adaptatieschema (ook wel applicatieprofiel genoemd) ontwikkelen, waarin naast een gestandaardiseerd basisschema eigen velden toegevoegd kunnen worden.
Bij het gestandaardiseerd aanbieden van informatie kan XML (Extended Markup Language) een belangrijke rol vervullen. Door het beschrijven van gegevens en het formuleren van standaarden, zoals Dublin Core, in XML (als taal) of het opslaan of exporteren van gegevens naar XML (als format) is het mogelijk gegevensverzamelingen zo beschikbaar te stellen dat ze altijd kunnen worden hergebruikt. Het XML-format is namelijk niet afhankelijk van platforms of gegevens. Gebruik van XML maakt het ook mogelijk zowel gegevensverzamelingen uit een databank als grote tekstcorpora (dus zowel gestructureerde als niet-gestructureerde gegevensverzamelingen) gemeenschappelijk ontsloten aan te bieden of te bevragen.
Data die op gestandaardiseerde wijze zijn beschreven, zowel formeel als inhoudelijk, maken het mogelijk ook on line gegevens uit te wisselen met anderen die van eenzelfde set van afspraken gebruik hebben gemaakt. Er zijn zoekprotocollen die voorschrijven hoe gegevens on line moeten worden aangeboden. Daarin wordt het gestandaardiseerde format genoemd waaraan gegevens moeten voldoen. Voorbeelden van formats voor het doorzoeken van data, zoals Z39.50 en het Open Archives Initiative, staan hier. Zoekmachines die gebruik maken van deze protocollen zijn in staat dergelijke gestandaardiseerd aangeboden informatie te vinden. Toegankelijkheid en hergebruik van een gegevensverzameling worden dus bevorderd door het gebruik van standaarden.
Niveaus
Archieven beschrijven hun gegevensverzamelingen op een hoger niveau (bijvoorbeeld inventarisniveau) dan musea, die doorgaans op objectniveau documenteren. Bij de uitvoering van een gemeenschappelijk informatieaanbod, in een sectoroverstijgend project, zal daarmee rekening moeten worden gehouden. Er moet dan bijvoorbeeld worden nagedacht over de verhouding tussen een objectencollectie en een archiefinventaris. Voorbeelden van formats voor de beschrijving van museale informatie op collectieniveau, zijn Musip (Museum Inventarisatie Project) en RSLP (Research Support Libraries Programme). Ook wordt daar verwezen naar EAD (Encoded Archival Description), dat steeds meer door archieven wordt gebruikt. Omdat beschrijvingsschema’s niet zonder meer op elkaar aansluiten, zal er altijd rekening moeten worden gehouden met een uiteindelijk informatieaanbod op objectniveau. Overigens zullen eindgebruikers, om een goed zoekresultaat te bereiken, bij een toenemend informatieaanbod on line steeds meer gebaat zijn bij een beschrijving op een hoger niveau.
Uniforme inhoudelijke ontsluiting
Semantische interoperabiliteit vereist het maken van afspraken over het beschrijven van de inhoud van gegevensverzamelingen. Standaardregels daarvoor worden bijvoorbeeld vastgelegd in gestructureerde woordenlijsten, classificaties en thesauri. Semantische interoperabiliteit is een nog grotendeels onontgonnen terrein. Iedere zichzelf respecterende sector gebruikt een gestandaardiseerd format waarin uit wetenschappelijke en domeinspecifieke overwegingen inhoudelijke kenmerken voor data zijn vastgelegd. Het streven naar gemeenschappelijk gebruik van dezelfde inhoudelijke beschrijvingsstandaarden in een sector of een samenwerking is voorlopig de hoogst mogelijk definieerbare graad van semantische interoperabiliteit. Het gebruik van een gestandaardiseerde inhoudelijke beschrijvingsstandaard zal bevorderlijk zijn voor de precisie van de zoekresultaten, omdat er dan duidelijkheid bestaat over het aangewende begrippenapparaat. Op www.rkd.nl staat een voorbeeld van een dergelijke standaard: de Art & Architecture Thesaurus.
De keuze voor een standaard die een bepaald kennisdomein bestrijkt, biedt in de toekomst ook on line voordelen bij de ontwikkeling van het semantisch web. In dat web moet informatie automatisch op betekenisvolle wijze kunnen samenkomen.
Vragen voor beschrijvingsstandaard:
  • Met welk doel is de standaard ontwikkeld en wat zijn de eigenschappen ervan?
  • Met welk doel wordt de bron beschreven?
  • Past de standaard bij uw doelstelling?
  • Wat zijn de beperkingen van de standaard?
  • Wat is de verhouding tussen de standaard en de technische ontwikkeling van de omgeving waarvoor die is gemaakt, welke organisaties ondersteunen en beheren de standaard?
  • Wat is de doelgroep, moet de bronbeschrijving bijvoorbeeld een educatief doel kunnen dienen?
  • Kunnen in een samenwerkingsproject gegevens worden uitgewisseld, bijvoorbeeld via mappings, met de andere deelnemers?
  • Zijn er nieuwe versies van het gestandaardiseerde format waarmee wordt gewerkt?
terug naar inhoudsopgave

opmerking

naar boven
Digitaal Erfgoed Nederland
Kwaliteitszorg
Register
DE BASIS
Projectenbank
ICT Monitor
DE Conferenties
KENNIS DELEN
Subsidiewijzer
Publicaties
Aanmelden nieuwsbrief
Digitaal Erfgoed Nederland (DEN)
Prins Willem-Alexanderhof 5
Postbus 90407
2509 LK Den Haag
T. +31 (0)70 314 0343
F. +31 (0)70 314 0100