Cookies op DEN.nl
den.nl maakt gebruik van cookies voor het anoniem meten van het website bezoek en het vergroten van het gebruiksgemak. Door op 'ga verder' te klikken, geef je toestemming voor het gebruik van deze cookies.

Studiedag Krantendigitalisering (2007)

4 oktober 2007




Op dinsdag 2 oktober 2007 vond in het Persmuseum te Amsterdam een studiedag plaats over digitalisering van historische kranten. Deze studiedag, een initiatief van de Nationale Werkgroep Krantendigitalisering, heeft als doel het bevorderen van deskundigheid van erfgoedinstellingen die historische kranten (willen) digitaliseren. De organisatoren van deze studiedag waren Digitaal Erfgoed Nederland, Erfgoed Nederland, Koninklijke Bibliotheek, Nederlands Instituut voor Oorlogsdocumentatie, Persmuseum, Taskforce Archieven, Tresoar en Vereniging van Openbare Bibliotheken/WSF.

Hieronder volgen de samenvattingen van de presentaties die op de studiedag gehouden zijn. De vragen uit het publiek zijn opgenomen en er is een verslag van de forumdiscussie waar de dag mee afgesloten is.


1. Krantendigitalisering in Nederland: de stand van zaken door Astrid Verheusen (Projectmanager, Koninklijke Bibliotheek)
Op dit moment worden in Nederland op grote schaal historische kranten gedigitaliseerd door bibliotheken, archieven en uitgevers. Een uitgebreide inventarisatie laat zien dat meer dan 120 titels in bewerking zijn voor digitalisering of al beschikbaar zijn gesteld op het internet. Kranten zijn bij uitstek geschikt voor digitalisering. Het materiaal levert een belangrijke, toegankelijke onderzoeksbron op, zowel voor wetenschapsgebieden als politicologie, (kunst)geschiedenis en sociologie, als voor de taalwetenschappen. Voor de eindgebruiker biedt het grote aantal krantentitels dat momenteel wordt gedigitaliseerd veel mogelijkheden. De vraag is echter of hij er bij is gebaat als iedereen op een andere manier digitaliseert. Kan een gebruiker straks op dezelfde manier zoeken in het Vrije Volk als in de Schiedamse Courant? En zijn al die verschillende websites over twintig jaar nog steeds beschikbaar? Wordt het gedigitaliseerde materiaal duurzaam bewaard? Een vraag die hier op volgt, is of de instellingen die bezig zijn met krantendigitalisering iets van elkaar kunnen leren en kunnen samenwerken zodat projecten op een gelijke - en wellicht efficiëntere - manier kunnen worden uitgevoerd. 
 
Eind 2006 vond in Utrecht een bijeenkomst plaats van instellingen die zich bezighouden met krantendigitalisering. De behoefte aan samenwerking op alle gebieden rond het digitaliseren van kranten bleek groot. Wat inmiddels is bereikt en waar de gaten liggen, is in de presentatie besproken aan de hand van de verschillende stappen in het digitaliseringstraject: financiering, projectmanagement, selectie en auteursrecht, materiaalanalyse, digitalisering en OCR, ontsluiting, opslag en beschikbaarstelling.

Astrid Verheusen (pdf) 

2. Krantendigitalisering in Nederland: selectie en ontsluiting door  Frank van Vree (Hoogleraar Journalistiek en cultuur, Universiteit van Amsterdam
  
Er zijn twee bijzondere aspecten aan het digitaliseren van kranten: de hernieuwde betekenis van de krant als bron en de gronden waarop de kranten worden geselecteerd voor digitalisering zoals voor het project Databank Digitale Dagbladen van de Koninklijke Bibliotheek. Op grond van jarenlang intensief gebruik van kranten als (historische) bron is de spreker de overtuiging toegedaan dat grootschalige digitalisering meer implicaties heeft dan men op het eerste gezicht zou denken: digitalisering is uiteindelijk minder een kwestie van kwantiteit dan van kwaliteit. Digitalisering opent nieuwe wetenschappelijke perspectieven – perspectieven die een rol hebben gespeeld bij het formuleren van de criteria aan de hand waarvan de Koninklijke Bibliotheek titels voor digitalisering selecteert. In de voordracht is ingegaan op de overwegingen die aan het selectieproces ten gronde liggen.

Vraag uit de zaal: Hoe zit het met de selectie van de koloniale kranten voor het project Databank Digitale Dagbladen?
Antwoord: Voor de koloniale kranten worden selectiecriteria opgesteld. De koloniale kranten zullen ruimschoots aan bod komen, kranten uit Indonesië, Suriname en de Antillen zullen voor digitalisering worden geselecteerd.

Frank van Vree (pdf)
 
3. Het organiseren van het digitaliseringsproces door Eva Wuyts (Projectleider Het Geheugen van Ieper)
Op 1 maart 2004 sloot de stad Ieper voor de duur van tien maanden een experimenteel erfgoedconvenant af met de Vlaamse Gemeenschap en richtte zij een Erfgoedcel op. De Ieperse aanvraag om een integraal en geïntegreerd lokaal erfgoedbeleid te gaan uitbouwen, werd gehonoreerd op basis van een tiental projectvoorstellen. Het accent lag op de collectie historische kranten. Omdat de middelen niet onbeperkt waren, moest een doordachte selectie worden gemaakt van de duizenden kranten die naar aanleiding van het project door de Stedelijke Openbare Bibliotheek overgedragen werden aan het Stadsarchief. Anderhalf jaar later, op 1 december 2005, werd het Geheugen van Ieper gelanceerd met een uitgebreide communicatiecampagne. Zo ontving elke Ieperling De Toekomst in de bus, een historisch uitziende krant met een selectie van de markantste artikelen, gecombineerd met uitleg over het project. Sindsdien is de erfgoedbank een belangrijke, veelgeraadpleegde bron geworden voor historisch onderzoek. De diverse keuzes die in het project zijn gemaakt, zijn in de presentatie nader toegelicht.

Vraag uit de zaal: Wat is de OCR-score van de kranten van het Geheugen van Ieper?
Antwoord: Het is nooit echt gecontroleerd, maar volgens zeggen is het ongeveer 70 à 80 %. Bij de voorbereidingen van het project was het een discussiepunt. Het is een keuze om genoegen te nemen met deze score en te accepteren dat een score van 100% niet haalbaar is.
Presentatie Eva Wuyts (pdf)

4. De gebruikers van digitale kranten door Ewoud Sanders (Journalist NRC)
Wat wil de gebruiker van historische kranten op internet? Wat voor informatie zoekt hij en hoe zoekt hij? En: wat zijn de consequenties voor dit gebruik voor de toegankelijkheid, de presentatie en de ´interactiviteit´ van historische kranten online? Op deze en andere vragen gaf de spreker een antwoord dat niet alleen gebaseerd was op zijn ervaringen als gebruiker van historische kranten, maar ook op zijn ervaring als samensteller van een grote, digitale taalbibliotheek.
5. Technische aspecten van krantendigitalisering
Gespecialiseerde bedrijven spelen een belangrijke rol bij de uitvoer van grootschalige projecten. De markt voor krantendigitalisering breidt zich uit en daarmee ook het assortiment aan technologische oplossingen. Dit kwam duidelijk naar voren uit een marktonderzoek dat de Koninklijke Bibliotheek onlangs heeft gedaan onder veertien nationale en internationale digitaliseringbedrijven. Nieuwe technologieën zoals zoning en segmentering maken het mogelijk een krant tot op artikelniveau toegankelijk te maken. Door optische tekenherkenning (OCR) kunnen kranten full-text doorzoekbaar worden gemaakt. Bij deze techniek is de foutmarge van de OCR-resultaten, zeker als het gaat om historische teksten, in veel gevallen nogal hoog. Op dit gebied is er nog veel te verbeteren.

Voor elk krantendigitaliseringsproject worden de technische vereisten uiteindelijk bepaald door inhoudelijke keuzes. Deze zijn afhankelijk van een aantal aspecten: de beschikbare middelen, de wensen van de gebruikers en het doel van het project. Wat de beste oplossing voor het project is hoeft daarom niet altijd de nieuwste technologische mogelijkheid te zijn.

Presentatie Edwin Klijn (pdf)

6. Juridische aspecten van krantendigitalisering
In zijn presentatie ging Frequin in diverse juridische aspecten die samenhangen met krantendigitalisering, zoals het internationale toetsingskader, het perspectief van de uitgever en de freelance journalist, het gezamenlijk belang, of er meer wetgeving nodig is of juist meer zelfregulering.

Presentatie Michel Frequin (pdf)

Tjeerd Schiphof (Universitair docent Juridische aspecten van kunst en cultuur, Erasmus Universiteit) 
 Het aanbieden van kranten via internet, in plaats van in de leeszaal of als papieren versie, verandert de juridische positie van de aanbieder. Zo zijn er consequenties op het gebied van auteursrecht en de bescherming van persoonsgegevens en op het punt van aansprakelijkheid jegens derden.
Publicatie via internet is een ´openbaarmaking´ in de auteursrechtelijke zin, zodat de aanbieder vaak toestemming nodig heeft van de rechthebbende (en dat kunnen er velen zijn) die vaak niet of moeilijk zijn te achterhalen.

Publicatie via internet is ook een handeling die geldt als een ´verwerking´ in de zin van de Wet bescherming persoonsgegevens, zodat ook aan de eisen van deze wet voldaan moet worden. Meer in het algemeen wordt door publicatie op internet de kans vergroot dat de aanbieder aansprakelijk is voor schade, niet alleen op de eerder genoemde terreinen, maar ook bijvoorbeeld wegens aantasting van eer of goede naam of het publiceren van een portret dat de geportretteerde liever uit de openbaarheid wil houden.

Presentatie Tjeerd Schiphof (pdf)

Vraag uit de zaal: Verandert er iets in de regels als je materiaal, waar geen auteursrecht meer op berust, tegen betaling aanbiedt?
Antwoord: In dat geval is er sprake van exploitatie op basis van het eigendomsrecht.
Vraag uit de zaal: Wat als een uitgever niet meer bestaat?
Antwoord: In dat geval kan hij zijn rechten niet uitoefenen. De rechten gaan dan weer terug naar de auteur of naar het publiek domein.
Vraag uit de zaal: Wie is de uitgever, die over de rechten van een publicatie kan beslissen?
Antwoord: Dat is de rechtspersoon die de publicatie openbaar heeft gemaakt (formeel heeft uitgegeven). 
 
7. Wat kost het digitaliseren van een krant? Marco de Niet (Directeur Digitaal Erfgoed Nederland) 
Deze presentatie behandelde de diverse aspecten die de uiteindelijke prijs bepalen van het digitaliseren van een krant. Aan de hand van een fictief voorbeeld werden diverse kostenposten nader onder de loep genomen, en waar mogelijk met concrete cijfers uit bestaande projecten ondersteund. Hierbij werd de hele cyclus van digitalisering doorlopen, van voorbereiding van de fysieke collectie via vervaardiging en opslag tot presentatie en duurzaamheid. Verder werden enkele tips gegeven om kosten te reduceren en externe financiering te vinden.

Presentatie Marco de Niet (pdf)

8. Een landelijke krantenportal? Vier jaar Presse-papier door Marc D'Hoore & Dirk Luyten (Project Presse Papier)
In 2003 sloegen de Koninklijke Bibliotheek, de Belgische nationale bibliotheek en de Stadsbibliotheek Antwerpen, de meest toonaangevende bewaarbibliotheken in Vlaanderen en eigenaar van een grote krantencollectie, de handen in elkaar om de problematiek van de permanente bewaring van de kranten aan te pakken. Het is de bedoeling om maximaal samen te werken met alle mogelijke bewaarinstellingen, die verspreid zijn over de verschillende beleidsniveaus van de Belgische staat. Tot nu toe heeft Presse-papier zich vooral toegelegd op het in kaart brengen en samenbrengen van de verschillende instellingen. Volgende stap is een collectieve catalogus, waar het bezit van de instellingen wordt samengebracht, met specificatie van de drager (papier, microfilm, gedigitaliseerde krant). Op die manier kan, zo is de verwachting, dubbel werk vermeden worden, kunnen gemakkelijker gezamenlijke initiatieven rond verfilming en digitalisering worden opgezet en kan, wanneer een instelling een krant wil verfilmen of digitaliseren maar niet over een volledige collectie beschikt, snel worden nagegaan waar de ontbrekende exemplaren zich bevinden.

Presse-papier werd tot nu toe niet extern gefinancierd, maar werd gedragen door de instellingen zelf. Recent gaf de Vlaamse gemeenschap een subsidie (50.000 euro) die de Stadsbibliotheek Antwerpen toelaat een projectmedewerker aan te werven die belast wordt met het construeren van een databank en het gecontroleerd invoeren van de bezitsgegevens. Presse-papier werd aanvankelijk gedacht als een faciliterend instrument voor microverfilming, maar intussen raakt digitalisering ook in België meer en meer ingeburgerd. Presse-papier kan nuttig zijn om initiatieven op beide terreinen te ondersteunen.

Presentatie Dirk Luyten & Marc D'Hoore (pdf)

9. Forumdiscussie / agenda voor de toekomst o.l.v. Angelie Sens (directeur Persmuseum)
Tijdens de discussie kwam een aantal onderwerpen aan bod. Hieronder volgt het verslag, dat op onderwerp is samengebracht.



Discussiepunten forum
 (pdf)

Nationale Kerngroep Krantendigitalisering
De kerngroep probeert een samenwerking op te zetten van instellingen die bezig zijn met krantendigitalisering. Het gaat om historische kranten. Aan de naam van de kerngroep zou daarom het woord “oude” of “historische” kunnen worden toegevoegd. De kerngroep biedt geen technische oplossing voor digitalisering aan, aangezien er veel aspecten komen kijken bij het digitaliseren. De kerngroep ziet het als haar taak op Nederlands niveau de samenwerking goed te organiseren. Voorlopig is geen sprake van een Europese samenwerking op dit gebied. Voor het juridische aspect, met name alles dat betrekking heeft op het auteursrecht, is wel sprake van Europese afstemming.

Samenwerking
Naast de samenwerking door de kerngroep kan ook met de industrie worden samengewerkt. De industrie is bereid mee te zoeken naar oplossingen, die nodig zijn voor de duurzaamheid van de digitale bestanden. Een voorbeeld is X-Cago die bij de uitvoer van het project van de Leeuwarder Courant samenwerking met de Fryske Akademy heeft gezocht. Dit heeft software voor de verbetering van OCR opgeleverd, die ook weer breder ingezet kan worden. In België bestaat geen gestructureerde samenwerking, of één gehanteerde technische oplossing, op dit gebied. De uitvoer van grootschalige projecten wordt altijd uitbesteed, waardoor natuurlijk wel samenwerking met de leverancier ontstaat.

Kennisverspreiding
Het opzetten van een forum blijkt voor dit onderwerp niet de juiste vorm. Er is maar een kleine groep die kennis en informatie aanlevert en een grotere groep die vooral deze kennis en informatie wil kunnen gebruiken. Wel is duidelijk dat er veel belangstelling is voor de kennis en informatie die de kerngroep beschikbaar stelt via de discussielijst krantdigi-l@nic.surfnet.nl.

Auteursrecht
Bij toestemming voor het publiceren van gedigitaliseerde titels zullen niet zo snel de volledige rechten worden overgedragen. De bijzondere persoonsgegevens, die veel in kranten voorkomen, zijn een apart geval. Het auteursrecht berust hier bij de auteur zelf, die in veel gevallen niet, of heel moeilijk, te achterhalen is. Het risico bestaat dat iemand een klacht indient en publicatie verbiedt. In Ieper wordt dat risico genomen, Ieper publiceert het materiaal uit 1920 en kan wellicht reacties van rechthebbenden ontvangen. De Groep Nederlandse Dagbladpers is in overleg met de Koninklijke Bibliotheek. Zij willen graag tot algemene afspraken komen, die ook voor anderen zouden kunnen gaan gelden. Dat zal in samenwerking moeten gaan met andere betrokken organisaties, zoals de Nederlandse Vereniging voor Journalisten. Er zijn samenwerkingsmodellen denkbaar waarbij sprake kan zijn van een win-winsituatie.

Landelijke portal
De vraag is in hoeverre er behoefte is aan een landelijke portal voor het historisch krantenmateriaal en of instellingen bereid zijn hun materiaal hiervoor beschikbaar te stellen. Het Regionaal Archief Leiden wil in ieder geval graag samenwerken en zijn bestanden beschikbaar stellen. Voor de uitwisseling is het handig te weten aan welke voorwaarden (technische kenmerken, o.a. metadata) bestanden moeten voldoen. De inventarisatie, zoals die nu op de DEN website te vinden is, zal worden bijgewerkt. Daarbij zal ook aanvullende informatie aan de instellingen worden gevraagd over de technische details. Zylab wijst op de mogelijkheid om gebruik te maken van een uniform platform waardoor informatie uniform kan worden aangeboden.

LexisNexis fungeert als portal voor actuele kranten, lopend vanaf begin jaren negentig. Het lijkt erop dat zij hun aanbod gaan uitbreiden, waardoor ook wat ouder materiaal bij het aanbod gaat horen. Uitgevers hebben commerciële belangen, waarvoor een afgebakend terrein geldt. Zij vervullen geen archieffunctie, zoals dat door de instellingen die het historisch materiaal digitaliseren wel wordt vervuld. Een ander opvallend verschil is het aanbod van foto’s. Bij het historisch materiaal zijn de foto’s een onderdeel van het geheel, terwijl het actuele aanbod van Lexis Nexis alleen bestaat uit tekst, de foto’s ontbreken.

Bibliografische benadering
Het Belgische Presse Papier heeft een bibliografische benadering voor het bij elkaar brengen van digitale kranten op landelijk niveau. Nederland kent de Landelijke Kranten Databank, een initiatief van Eric Hennekam, die via de website van het Persmuseum beschikbaar is. Deze is echter verre van volledig. Er bestaat geen volledig overzicht van alle in Nederland uitgekomen krantentitels. Wellicht is de Belgische benadering ook voor Nederland aantrekkelijk, bijvoorbeeld door de Centrale Catalogus van Dagbladen (CCD) nieuw leven in te blazen.

Aanvullende informatie: Voor het project Databank Digitale Dagbladen wordt gebruik gemaakt van het GGC (Gemeenschappelijk Geautomatiseerd Catalogiseersysteem). Het systeem wordt voor het project aangepast en met filters bewerkt, waardoor betere groslijsten van krantentitels beschikbaar komen. Het resultaat komt te zijner tijd ook via de website van het project beschikbaar (www.kb.nl/projectdagbladen). Het overzicht zal niet volledig zijn, maar het levert wel een verbetering op in vergelijking met de huidige situatie.

Met dank aan Miluska Dorgelo van de Koninklijke Bibliotheek voor de verslaglegging. Foto's: Gerben van der Meulen (IISG).
10 plus 5 is:*
(anti-spam)

Reacties (0)

Er zijn nog geen reacties geplaatst.