Direct naar de inhoud Direct naar het menu Direct naar de zoekfunctie Direct naar de footer

Automatiseer je auteursrechten: hoe technologie een handje kan helpen

Het uitzoeken van auteursrechten is arbeidsintensief, zeker als je dat voor grote collecties wilt doen. DEN heeft hier bijvoorbeeld een stappenplan voor geschreven. Toch zou het fijn zijn als de technologie een handje kan helpen om die rechten uit te zoeken. In hoeverre biedt automatisering een oplossing? Hanno Lans is dataspecialist en oprichter van CopyClear. Hij laat in dit artikel zien hoe je het clearen van rechten kunt automatiseren door bijvoorbeeld verschillende databases aan elkaar te koppelen.

Erfgoedinstellingen met beeldarchieven worden regelmatig geconfronteerd met auteursrechtenclaims. Het gevolg hiervan is dat verschillende instellingen besloten hebben om hun beeldbank uit te schakelen in de hoop op een duurzame oplossing. Het doornemen van auteursrechten van een collectie is echter zeer arbeidsintensief en kost bij het handmatig doornemen jaren fulltime werk. Bij verschillende erfgoedinstellingen wordt daarom gekeken naar automatisering hiervan. Maar hoe gaat dat in z'n werk?

Onderscheid tussen publiek domein en beschermd

Hoe kun je automatisering inzetten om auteursrechtenstatussen inzichtelijk te maken? Een eerste stap die je kunt maken is het aanbrengen van een driedeling tussen materiaal dat zeker auteursrechtelijk beschermd is, materiaal dat zeker tot het publiek domein behoort, en materiaal waarvoor nader onderzoek naar de rechtsstatus nodig is. Van het merendeel van een collectie kun je namelijk al zeggen of het al dan niet auteursrechtelijk beschermd is. Al het naoorlogse materiaal is namelijk gegarandeerd auteursrechtelijk beschermd, terwijl al het materiaal van meer dan 200 jaar geleden gegarandeerd wereldwijd publiek domein is. Dat komt doordat er bijna overal wetten zijn die vastleggen dat de auteursrechten na het overlijden van de maker na een vast aantal jaren verlopen. Die periode verschilt van 50 tot 100 jaar na het overlijden van de maker, maar in Nederland en de meeste andere Europese landen is die periode vastgesteld op 70 jaar. Zonder verder veel te weten van de collectie, kom je op deze manier al een heel eind door een csv-bestand te filteren op de creatiedatum. Al het publiek domeinmateriaal kan zonder risico online, al het beschermd materiaal mag niet online.

Grafiek: auteursrechtensituatie van de collectie van museum Boijmans van Beuningen. Ongeveer eenderde van de collectie van Boijmans van Beuningen behoort tot het publieke domein. Dat komt met name door de grote prentencollectie die zij bezitten. Voor instellingen met alleen fotografisch materiaal is een dergelijke methodiek niet toepasbaar, bij ieder fotografisch werk dienen de auteursrechten gecontroleerd te worden.

Profilering

Iets meer verfijning is mogelijk door profielen te maken van de makers. Zo is het aan de hand van de werken mogelijk de werkperiode van de maker te bepalen, en daarmee ook een inschatting te maken van de periode dat de maker geleefd zou hebben. Het is daarnaast voor het auteursrecht relevant of het een persoon of een organisatie betreft. Ook is het mogelijk aan de hand van het soort objecten het beroepsveld van de vervaardiger te destilleren. Zo zijn foto’s gemaakt door een fotograaf en schilderijen door een kunstschilder. Een dergelijke beroepsafbakening is met name praktisch als het gaat om het online zoeken naar meer informatie over de vervaardiger.

Het zoeken naar meer informatie over personen levert relevante informatie op die weer van belang kan zijn om meer te kunnen zeggen over het auteursrecht. Voor de groep waarvan de auteursrechtelijke status onzeker is, is het van belang de overlijdensdatum te registreren. Voor auteursrechtelijk beschermde werken is het handig om contactgegevens te hebben van de auteursrechtelijke vertegenwoordiger. Dat kan bijvoorbeeld een collectieve beheerorganisatie zijn, het Nederlands Fotomuseum, een galerie of het Maria Austria Instituut. In de meeste gevallen gaat het echter om de kunstenaar zelf of de erven daarvan. Veel hedendaagse kunstenaars hebben een website en een LinkedIn-profiel, dan is het contact makkelijk te leggen.

Koppeling

Als je geautomatiseerd aan meer gegevens wilt komen, is het een logische volgende stap om de profielen te koppelen aan externe databronnen waarin deze gegevens al te vinden zijn. Dergelijke databronnen zijn bijvoorbeeld RKD Artists, databestanden van collectieve beheerorganisaties of Wikidata. De contactgegevens en geboorte- en sterfdata van makers zijn via deze bronnen snel te achterhalen. Deze gegevens kunnen weer gebruikt worden om de profielen van de kunstenaars verder te verfijnen. We hebben dan de beschikking over een groep vervaardigers met een website, we weten wie van pensioengerechtigde leeftijd is of wie is aangesloten bij een collectieve beheerorganisatie. Elk van deze groepen vraagt een andere aanpak.

Filmmaker George Krugers. Aanvankelijk stond op internet dat deze filmmaker meer dan 70 jaar geleden overleden was in Nederlands-Indië. Als filmmaker heeft hij de pelgrimsvaart naar Mekka voor het eerst op film vastgelegd. Na het plaatsen van filmmateriaal op Wikipedia meldde zijn zoon zich echter als rechthebbende. Zijn vader bleek in 1964 in Den Haag overleden. Direct daarop is zijn informatie aangepast in Wikidata en heeft zijn zoon divers beeldmateriaal onder Creative Commons vrijgegeven.

Wachten op botjes

Van de vervaardigers van wie zich werk in museale collecties bevindt, zijn de gegevens wel te vinden in de bekende datasets. Voor veel vervaardigers in de collecties van archieven geldt dat niet. Ook hiervoor is echter een geautomatiseerde oplossing mogelijk. De aanpak hiervoor is om de profielen naar Wikidata weg te schrijven. Wikidata is namelijk de snelgroeiende database achter Wikipedia en biedt de mogelijkheid om aan te vullen met nog niet opgenomen vervaardigers. Hierdoor kunnen de profielen van de vervaardigers geautomatiseerd aangemaakt worden met als bron een link naar de instelling. Als ze eenmaal zijn weggeschreven, is het afwachten. Afwachten tot er een zogenaamd botje langskomt. Op Wikidata huizen verschillende botjes, die proberen de data op Wikidata te verrijken. Dat doen ze bijvoorbeeld door te kijken of de naam toevallig voorkomt in een van de duizenden datasets die in de wacht klaarstaan. Andere botjes proberen de profielen te verbeteren, bijvoorbeeld door de voor- en de achternaam uit de naam te destilleren, door aan de hand van de voornaam het geslacht te bepalen en door de voornamen te verwerken tot initialen. En tot slot vinden er met grote regelmaat uploads plaats waarbij de personen gekoppeld worden aan andere collecties. Na een jaar is de dataset verrijkt en kunnen de extra gegevens geautomatiseerd als linked open data binnengesleept worden. Op een dergelijke manier worden bijvoorbeeld alle hoogleraren van Nederland in Wikidata geplaatst. Soms niet meer dan een naam, maar al snel verrijkt met de universiteit, functies en literatuur.

Automatische aanvulling van gegevens bij de Nederlandse kunstschilder Jacob Abels in Wikidata. Onder meer wordt toegevoegd dat de National Gallery of Art ook werken in de collectie heeft.

Beeldanalyse

De genoemde strategie gaat ervan uit dat van werken een vervaardiger bekend is. Iedere erfgoedinstelling kent echter ook een grote hoeveelheid werken, waarbij geen vervaardiger genoteerd is. De uitdaging is om ook dit deel geautomatiseerd te verwerken. Als er geen verdere metagegevens ter beschikking staan, dan is beeldanalyse een mogelijkheid. Beeldanalyse doen conservatoren ook met de hand, maar wat zijn de mogelijkheden om dat geautomatiseerd te doen?

Een eerste mogelijkheid is om fotografisch materiaal te vergelijken met materiaal op internet. Dit is een goede manier om beeldmateriaal te vinden dat in wijd gereproduceerd is, zoals persfoto’s. Onderzoek naar de herkomst van een foto op andere manieren, zoals via datering of aan de hand van schaduwen, het type camera en vervorming, vereist gespecialiseerd forensisch onderzoek dat nog niet op grote schaal wordt toegepast. Een voorbeeld van een erfgoedinstelling waarbij dit wel succesvol toegepast is, is het Anne Frank Huis, dat van foto’s heeft geanalyseerd wie de vervaardiger zou kunnen zijn door een analyse te maken met welk cameratype het gemaakt is. Vooralsnog lijkt beeldanalyse alleen nog geschikt voor analyse van exacte kopiën, zoals ook BumaStemra en Google doen.

Wat wel mogelijk zou moeten zijn is analyse van de techniek. zoals daguerreotypes en Cartes de Visits.

Auteursrechtelijke analyse

Als de vervaardigers en alle gegevens bekend zijn, is het bij de groep 'mogelijk publiek domein' nog steeds de vraag hoe we we geautomatiseerd een conclusie kunnen trekken over de auteursrechtenstatus met de verkregen data. Om ook hiervoor houvast te bieden, zijn we bij Wikidata aan het kijken hoe de auteursrechtelijke status van een vervaardiger in Wikidata kan worden bijgehouden. Grofweg kan een vervaardiger gekenmerkt worden door werken te hebben die wereldwijd publiek domein zijn, in een deel van de wereld publiek domein zijn en die nergens publiek domein zijn. Als we deze informatie in Wikidata hebben staan, kunnen we die vervolgens op de collectie toepassen. Dat kan zelfs in die gevallen waarbij geen exacte sterfdata bekend zijn, puur door de eerder genoemde profielinformatie. Hiervoor wordt momenteel in Wikidata gewerkt aan een analysetool, waarbij de status wordt vastgesteld aan gerelateerde data, zoals werkperiode en gemaakte werken. Indien deze tooling op Wikidata is ingericht, kan deze net als andere botjes automatisch de eerder genoemde profielen voorzien van een auteursrechtelijke status. Grotendeels kun je dit nu ook al zelf doen door alle werken waarvan bekend is dat de vervaardiger meer dan 70 jaar overleden is tot het publieke domein te verklaren.

Aandacht voor de top

Naast het binnenhalen van informatie is het ook interessant om informatie toe te voegen. Iedere erfgoedinstelling heeft ook een groep vervaardigers waarover het veel weet. Voor zover deze informatie in een database staat, is het goed deze dataset actief op Wikidata te plaatsen. Daarmee wordt je erfgoedinstelling op dat gebied beter gevonden en ontstaan er koppelingen met andere collecties, die daardoor hun eigen informatie kunnen aanvullen. Aardige bijkomstigheid is dat de gegevens uit Wikidata doorstromen over het hele internet: De library of Congress creëert identifiers aan de hand van wikidata, Google gebruikt het om informatie aan internetgebruikers te tonen, MoMA toon de informatie van Wikidata bij hun collectie en Wikipedia-schrijvers en journalisten hebben gegevens om een artikel te kunnen schrijven. Door zelf actief informatie toe te voegen, draag je dus ook bij aan meer transparantie omtrent makers en auteursrechtenstatussen bij allerlei instellingen wereldwijd. 

Hanno Lans

Hanno Lans

Dataspecialist en oprichter van CopyClear

Hanno Lans werkt sinds 1999 aan de advisering, begeleiding en implementatie van webprojecten voor culturele instellingen en overheden. In 2015 is hij van start gegaan met een concept om geautomatiseerd collecties te kunnen doornemen op auteursrechtelijke status onder de naam CopyClear.