Cookies op DEN.nl
den.nl maakt gebruik van cookies voor het anoniem meten van het website bezoek en het vergroten van het gebruiksgemak. Door op 'ga verder' te klikken, geef je toestemming voor het gebruik van deze cookies.

DE BASIS voor beschrijving

Beschrijven van erfgoed is een essentiële schakel in de dienstverlening van erfgoedinstellingen. Zolang zoektechnieken als beeld- en audioherkenning experimenteel zijn, zijn tekstuele beschrijvingen onmisbaar in de communicatie met de doelgroepen. Maar het volstaat niet om volstrekt naar eigen inzicht erfgoed te beschrijven. Zoals standaard bestandsformaten nodig zijn om duurzame toegankelijkheid en hergebruik van data mogelijk te maken, is het gebruik van standaardmethoden voor metadatering, inhoudelijke ontsluiting en identificatie van digitale erfgoedcollecties en -objecten van groot belang. Die standaardmethoden helpen om een zo breed mogelijk bereik te hebben met het digitale erfgoed.

 


Metadata

Metadata zijn gestructureerde gegevens die de archivering, ordening, (her)vindbaarheid en toegankelijkheid van fysieke of digitale objecten bevorderen. De vier belangrijkste soorten metadata die kunnen worden onderscheiden zijn:
  • beschrijvende metadata (nodig voor het identificeren en vinden van objecten),
  • structurele metadata (deze leggen de relatie vast tussen individuele objecten die gezamenlijk een eenheid vormen),
  • technische metadata (bijvoorbeeld informatie over de vervaardiging van het object),
  • administratieve metadata (deze richten zich op beheer en management van objecten).
Voor het beter vindbaar maken van collecties voor het publiek zijn beschrijvende metadata nodig. Breed geïnterpreteerd zijn dit alle gegevenselementen waarop bezoekers mogelijk kunnen zoeken.
 
Metadata hebben alleen betekenis in samenhang met het object die ze beschrijven. Deze relatie kan op verschillende manieren worden beheerd. Traditioneel worden de metadata los van het beschreven object bewaard. Een vorm van identificatie die zowel op het object aanwezig is als in de beschijving vormt de connectie. Bij digitale objecten wordt de bestandsnaam vaak als identificatie gebruikt. Een volgende stap is de identificatie en eventueel ook andere eigenschappen in het digitale object zelf te verpakken. Veel bestandsformaten bieden de mogelijkheid om metadata op te slaan als digitaal label aan het bestand zelf (bijvoorbeeld Exif). De meest geavanceerde vorm van databeheer vormen de containerformaten waarbij verschillende soorten metadata samen met een of meer computerbestanden als één digitaal object worden opgeslagen, zoals METS en MPEG21-DIDL.


Inhoudelijke ontsluiting

Inhoudelijke ontsluiting wordt meestal gebruikt voor het toekennen van termen uit terminologiebronnen, bijvoorbeeld thesauri, (gecontroleerde) trefwoordenlijsten, taxonomieën, classificaties of ontologieën. Uniforme inhoudelijke ontsluiting vereist afspraken over de wijze van beschrijven van de inhoud.
 
Voor inhoudelijke ontsluiting biedt het gebruik van een terminologiebron, zoals een taxonomie, thesaurus of ontologie, grote voordelen. Bij goed gebruik ervan worden gelijke trefwoorden in gelijke omstandigheden toegekend. Voor de gebruikers resulteert dit in uniformiteit van de beschrijvingen, wat de vindbaarheid ten goede komt.
 
Het gebruik van een terminologiebron voor onderwerpsontsluiting geldt als minimale eis. Voor uniforme toekenning van persoons- en instellingsnamen, tijds- en plaatsaanduidingen, materialen en technieken, en typeaanduidingen is het gebruik van terminologiebronnen een aanbeveling. Voorkeur heeft aansluiting bij een bestaande terminologiebron. In de kennisbank van DEN zijn gangbare terminologiebronnen voor het erfgoed opgenomen.

De keuze voor een terminologiebron wordt sterk bepaald door de aard van het te beschrijven object of de collectie. Toch is het belangrijk bij de keuze voor een bepaalde terminologiebron ook te kijken naar andere eigenschappen, zoals:
  • berust er auteursrecht op de terminologiebron?
  • wie voert beheer/redactie uit?
  • mogelijkheid om nieuwe termen toe te voegen of voor te stellen
  • mogelijkheid om de lijst inhoudelijk aan te laten sluiten op andere terminologiebronnen
  • doelgroep
  • meertaligheid
  • updatebeleid/versiebeheer
  • andere gebruikers
  • dekkingsgebied (wat wordt behandeld)
  • mogelijkheid om de woordenlijst in SKOS uit te drukken


Identificatie

In een samenhangend netwerk van contentleveranciers die beschrijvende metadata toegankelijk maken voor hergebruik is identificatie een essentieel onderdeel.
 
Ten eerste moeten alle metadata, die voor hergebruik over het internet worden uitgewisseld, worden voorzien van een vorm van identificatie. De identificatie verwijst (permanent) naar de bron, het (digitale) object in beheer bij een specifieke contentleverancier of bronhouder. Dit maakt het mogelijk om bijvoorbeeld een nieuwere versie van de data op te vragen, de bron te verrijken met extra data, om van hetzelfde item dezelfde data in een andere vorm op te vragen of om aanvullende data van het item op te vragen.
 
Ten tweede is het noodzakelijk dat identificatie kan worden gebruikt om toegang tot het erfgoedobject zelf te krijgen. De ambitie van de Digitale Collectie Nederland gaat verder dan het niveau van informatie over het object (beschrijvende metadata). Als het object, dat gevonden kan worden door de beschrijvende metadata, in digitale vorm beschikbaar is, kan het publiek directe toegang via het internet worden geboden tot digitale reproducties van het erfgoed. Op die manier maakt de Digitale Collectie Nederland een voorheen ondenkbaar gebruik van het Nederlandse erfgoed mogelijk. Voor de identificatie van het object binnen de metadata geldt URI al als minimumeis binnen DE BASIS.


Toepassing

Beschrijving is het onderdeel binnen de kwaliteitscyclus waar (beschrijvende) metadata, inhoudelijke ontsluiting en identificatie tot stand komen. In DE BASIS zijn Dublin Core, XML en URI reeds aangewezen als minimale standaarden voor vindbaarheid. Een minimale eis voor de beschrijving van erfgoed is de mogelijkheid om de objecten (collecties, voorwerpen, personen, etc.) in XML/Dublin Core toegankelijk te maken voor hergebruik.
 
Doel van DE BASIS is het identificeren en normeren van standaarden en richtlijnen voor beschrijving die de kwaliteit van de XML/Dublin Core-output verbeteren. Eén manier daartoe is om te redeneren vanuit het publieksbelang. Voor flexibel (her)gebruik van de beschrijvingen van digitale objecten is het belangrijk dat minimaal de generieke vragen kunnen worden beantwoord: wie, wat, waar, wanneer en hoe?
 
DE BASIS stelt voor beschrijving de beantwoording van deze vragen verplicht waarbij overigens de waarden 'geen' (in dat geval niets invullen) en 'onbekend' mogelijk moeten zijn. De instelling heeft haar eigen en waarschijnlijk veel uitgebreidere beschrijvingssystematiek, maar met het oog op samenwerking en interoperabiliteit van (beschrijvende) metadata gaat DE BASIS uit van het minimum dat in Dublin Core kan worden vastgelegd. De minimale eis is dat het eigen metadataschema kan worden vertaald (door middel van een "mapping") naar gestandaardiseerde Dublin Core-elementen.
 
wie dc.creator, dc.contributor, dc.publisher
wat dc.title, dc.description, dc.subject
waar dc.coverage
wanneer dc.date
hoe dc.type, dc.format
Wie, wat, waar, wanneer en hoe uitgedrukt in Dublin Core-elementen

Uiteraard betekent deze aanpak een aanzienlijke versimpeling van de (vaak complexe) praktijk bij beschrijvingen van erfgoedobjecten: het vormt dan ook de minimale norm. Aanvullende methodes om rijkere informatie te gebruiken blijven mogelijk zonder dat de bijdrage van een instelling aan de Digitale Collectie Nederland in gevaar komt.
De voorgestelde aanpak kan gebruikt worden door samenwerkende erfgoedinstellingen afkomstig uit verschillende erfgoedsectoren. Er is dus sprake van een consensusmodel. Een bekende discussie die plaatsvindt tussen archieven en verschillende musea heeft betrekking op de informatie die bij 'wie' moet worden ingevuld. De meeste musea vertalen de persoons- en instellingsinformatie naar het veld 'wie'. Archieven (uit de aard van hun bronmateriaal) geven vaker de voorkeur deze informatie in het veld 'wat' onder te brengen.
Voor identificatie geldt URI al als minimale eis. De beschrijving moet er op gericht zijn deze URI (bij voorkeur als HTTP + een persistent identifier) in dc.identifier toegankelijk te maken.


Semantisch web

Tot nu toe zijn het vooral mensen die de koppelingen tussen verschillende informatiebronnen (handmatig) aanbrengen. Terwijl de informatie-omvang op Internet als maar verder groeit, zou het wenselijk zijn wanneer betekenisvolle informatie tussen servers kan worden uitgewisseld zonder menselijke tussenkomst. Deze betekenisgeving wordt meestal gebaseerd op gestructureerde annotaties of metadata (schema's en profielen). Door de overeenkomende structuren kunnen automatisch inhoudelijke relaties binnen en tussen documenten worden gelegd. Het semantisch web is nog in ontwikkeling, maar door digitale objecten van metadata te voorzien en daarbij zoveel mogelijk gebruik te maken van inhoudelijke ontsluiting, wordt een belangrijk fundament voor het semantisch web gelegd.
(Zie voor meer informatie o.a. het artikel van Tim Berners-Lee over Linked Data)


Documentatie


Expertteam

Deze tekst is opgesteld in samenspraak met experts op het gebied van beschrijving en in overleg met de adviesraad van de kennisbank. De beschreven standaarden en richtlijnen maken onderdeel uit van DE BASIS.
__________


Laatst gewijzigd: 04-06-2012

4 plus 5 is:*
(anti-spam)

Reacties (0)

Er zijn nog geen reacties geplaatst.