Cookies op DEN.nl
den.nl maakt gebruik van cookies voor het anoniem meten van het website bezoek en het vergroten van het gebruiksgemak. Door op 'ga verder' te klikken, geef je toestemming voor het gebruik van deze cookies.

Van Rijn naar Donau

29 januari 2010 - Marco Streefkerk
Afgelopen week was ik bij een bijeenkomst van Europeana in Berlijn. Onderwerp van gesprek: het Europeana Data Model (EDM). Op tafel lag versie 4 waarvan hieronder een uitwerking is te zien.

[caption id="attachment_1515" align="alignnone" width="459" caption="Europeana Data Model"]Europeana Data Model[/caption]

In twee dagen van presentaties, demonstraties en discussies moesten we komen tot versie 5 die als basis voor de belangrijkste toegang voor Europees Erfgoed voor de komende jaren moet dienen. De doelstelling vanuit de EU daarbij is geen kleintje: de zoekdienst moet beter zijn dan datgene wat de Europese burger nu in de meeste gevallen zal gebruiken: een internet zoekmachine zoals Google.

De introductie van het EDM markeert de overgang tussen versie 1 (verwacht dit najaar) en versie 2 van Europeana die medio 2011 is gepland. De projectorganisatie vernoemt de versies naar Europese rivieren: van de Rijn naar de Donau. Nu is dit geografisch geen hele grote afstand en ligt er een kanaal als directe verbinding, binnen Europeana is toch wel sprake van een enorme stap.

Tot op heden was de aanpak gericht op de grootste gemeenschappelijke deler tussen de beschrijvingen van al die diverse collecties uit al die landen. De Rijn-versie werkt met de Europeana Semantic Elements: in de kern Dublin Core met wat aanvullende velden.

Voor de Donau is gezocht naar een gemeenschappelijk model van een dusdanig hoog abstractieniveau dat het voor alle onderdelen van het erfgoed bruikbaar is. Het model is geïnspireerd door bestaande datamodellen (zoals CIDOC-CRM) en opgezet als een ontologie. Daarnaast moet EDM aansluiten bij het Semantische Web en Linked Data. Vanuit mijn verleden in de wetenschappelijke bibliotheek ben ik persoonlijk zeer nieuwsgierig naar het gebruik van (onderdelen van) OAI-ORE.

Ik vind de aandacht voor datamodellering goed. Ook voor DE BASIS hebben we gedacht aan een ontologie om het erfgoed als gemeenschappelijke onderwerp te beschrijven. Probleem daarbij is: als je overeenstemming bereikt op een dergelijk hoog abstractieniveau als een ontologie (wat al lastig genoeg is), moet het nog werkend gemaakt worden in de praktijk. Vanuit de ervaringen met bijvoorbeeld CIDOC-CRM is enige scepsis logisch. Maar met een positieve insteek kan je ook zeggen dat met de opkomst van het semantisch web ontologieën een come-back maken.

Feit is wel dat Europeana een zeer ambitieuze planning hanteert. Er is weinig ruimte voor het opdoen van ervaringen met het huidige model (op basis van ESE). Ervaring die zeer nuttig kan zijn bij het in de praktijk brengen van het nieuwe model (EDM) op het diverse erfgoed. Tijdens de bijeenkomst deze week werden wel al voorbeelden getoond, naast de onvermijdelijke Mona Lisa, van hoe beschrijvingen van boeken, kranten en video als eigenschappen, waarden en relaties in het theoretische model passen. Vervolg bijeenkomsten voor de afzonderlijke domeinen moeten de (on)mogelijkheden verder in kaart brengen. Hoe zit het bijvoorbeeld met archieven (EAD), AV-collecties (Frbr) en archeologie en monumenten (GIS)?

Een ander vraagstuk waar in Berlijn nog nauwelijks aandacht aan kon worden besteed is in hoeverre het model in staat is om de gevraagde functionele specificaties te leveren. Daar zijn immers al lijvige documenten aan gewijd. Bij het realiseren daarvan moet de Donau-versie daadwerkelijk een grote verbetering voor de gebruikers leveren. Als Europeana daarbij teleurstelt is er het risico dat de politiek in Brussel haar enthousiasme voor de Europese erfgoedsite verliest en de geldkraan dichtdraait.

Heikel punt daarin blijft de meertaligheid. Domme zoekmachines zoals Google lijken steeds beter in staat om over taalgrenzen heen te werken, ook natuurlijk omdat ze het Engels als de facto standaard hanteren. Uniforme betekenis en intelligentie bieden voor de zes kerntalen van de EU, zoals van Europeana wordt verwacht, plus het respecteren van de (historische) taalcultuur van de verschillende erfgoedcollecties vormt een uitdaging waarvoor een oplossing nog niet in zicht is. Vanuit de aanwezigen in Berlijn kwam het verzoek om proefdata vrij beschikbaar te maken zodat onderzoekers wereldwijd zich op dit vraagstuk kunnen storten.

Na twee dagen Berlijn is mijn eigen conclusie dat Europeana voor een enorme uitdaging staat. Het project vormt een katalysator voor iedereen die overtuigd is van het belang van samenwerking en openheid bij het realiseren van een belangrijke maatschappelijke rol voor erfgoed in de digitale wereld. Een kritische maar tegelijk actieve en constructieve houding van dataproviders, de collectiebeheerders, ook in Nederland is essentieel voor het succes van Europeana. DEN zal daarbij waar mogelijk ondersteunen en aanjagen.
Tags:
semantisch web   Europeana  
10 plus 5 is:*
(anti-spam)

Reacties (1)

Marco Streefkerk - maandag 15 maart 2010 om 16:18
Alle presentaties gebruikt tijdens de bijeenkomst zijn inmiddels beschikbaar op: http://version1.europeana.eu/web/europeana-project/wp3berlin