Cookies op DEN.nl
den.nl maakt gebruik van cookies voor het anoniem meten van het website bezoek en het vergroten van het gebruiksgemak. Door op 'ga verder' te klikken, geef je toestemming voor het gebruik van deze cookies.

Making Sense of Illustrated Handwritten Archives

Projectgegevens




Beschrijving

Omdat handgeschreven archieven nog altijd moeizaam doorzocht kunnen worden door computers is de daarin opgeslagen kennis moeilijk toegankelijk voor het grote publiek. Dat beperkt de mogelijkheden voor hergebruik van dit belangrijke erfgoed. In Making Sense of Illustrated Handwritten Archives onderzoeken we hoe kunstmatige intelligentie kan helpen handgeschreven teksten en tekeningen in gedigitaliseerde archieven te doorzoeken en te netwerken.

De service die we op basis van het onderzoek ontwikkelen bestaat uit vijf deelsystemen. Het eerste analyseert de compositie van de documenten en “knipt” ze op in elementen, bijvoorbeeld tekst en tekeningen. Het tweede deelsysteem doorzoekt die verschillende elementen en kent mogelijke betekenissen toe aan belangrijke woorden en beelden, zoals namen van diersoorten en plaatsen.

Het eerste en tweede deelsysteem moeten leren de elementen waarnaar ze moeten zoeken te herkennen. Daarvoor roepen we de hulp in van online vrijwilligers, die geannoteerde voorbeelddocumenten zullen maken. Het derde deelsysteem verzamelt de voorlopige resultaten en legt met behulp van achtergrondkennis zoals plaatsnamenlijsten, de meest waarschijnlijke betekenis van elk gevonden resultaat vast. Het vierde deelsysteem zoekt naar links tussen de vastgelegde informatie en andere informatiebronnen, bijvoorbeeld collectiecatalogi, en registreert deze. Een intuïtieve gebruikersschil om de andere vier deelsystemen heen vormt het laatste deelsysteem.

In deze aanpak is een hoofdrol weggelegd voor het word-retrieval systeem MONK, ontwikkeld aan de Rijksuniversiteit Groningen. Door de unieke architectuur van MONK is het systeem in staat om een zeer hoog niveau van woord- en beeldherkenning te bereiken in een grote diversiteit aan handschriften. MONK werd oorspronkelijk ontwikkeld als onderdeel van CATCH, in het project SCRATCH (SCRipt Analysis Tools for the Cultural Heritage).

Als centrale use case gebruiken we de collectie van de Natuurkundige Commissie voor Nederlands-Indië van Naturalis. Tussen 1820 en 1850 brachten teams van wetenschappers de natuurlijke en economische staat van Nederlands-Indië in kaart. Deze Natuurkundige Commissie bracht een schat aan wetenschappelijke data en objecten terug naar Leiden, bestaande uit duizenden veldnotities, dagboekpagina's, illustraties, planten, dieren en gesteenten. De collectie vormt nog steeds een van de belangrijkste nationale natuurhistorische collecties van Nederland en maakt Naturalis tot een uniek kennisinstituut voor biodiversiteit in Zuid-oost Azië. De papieren neerslag van de Natuurkundige Commissie, ruim 17.000 pagina's, werd tussen 2008 en 2012 met financiering uit Metamorfoze volledig gedigitaliseerd.

Het onderzoeksteam is een mix van computerwetenschappers, wetenschapshistorici en erfgoedprofessionals, aangevuld met kenners van de creatieve industrie, die elk hun eigen  kennis inbrengen om de service te leren en te optimaliseren.



Projecttypering
  • Onderzoeksproject

Status
In uitvoering

Projectwebsite
www.brill.com/about/making-sense-illustrated-handwritten-archives

Projectplan
Ja, maar niet gepubliceerd

Contactpersoon
Dr. Andreas Weber | a.weber[at]utwente.nl

Projectorganisatie


Betrokken instellingen uit het overzicht van DEN
Universiteit Leiden (projectleider)
Naturalis Biodiversity Center (projectpartner)
Rijksuniversiteit Groningen (projectpartner)
Universiteit Twente (projectpartner)

Financiering


Budget
€ 896.518

Toelichting fondsen of subsidiegevers
NWO/Creatieve Industrie

Resultaten


Projectresultaat
  • Het gebruik van Semantische Web technieken (Web3.0)
  • Infrastructurele voorziening
  • Informatiedienst voor het publiek

Doelgroep
  • Vakgenoten
  • Amateuronderzoekers
  • Wetenschap

Collectietypering
  • Boeken
  • Prenten en tekeningen
  • Objecten

Omvang collectie
17.000 pagina's


Domein
  • Bibliotheken
  • Archieven
  • Musea

Digitalisering


Uitvoering digitalisering
  • Niet van toepassing

Gekoppelde standaarden

Resource Description Framework
Simple Knowledge Organisation System

Evaluatie


Laatst gewijzigd: 13-12-2016

Tags:
2 plus 9 is:*
(anti-spam)

Reacties (0)

Er zijn nog geen reacties geplaatst.