12-04-11 10:02
Gisteren had ik een afvaardiging op bezoek van de Koninklijke Bibliotheek. Onderwerp van gesprek was de problematiek rond het duurzaam archiveren van digitale publicaties. Dat heeft meer voeten in de aarde dan je op het eerste gezicht zou denken.
Als er één onderwerp complex is, dan is het wel ‘ebooks en bibliotheken’. Niet alleen het ‘uitlenen’ van digitale boeken zorgt voor de nodige hoofdbrekens, ook het archiveren van digitaal materiaal is lastige materie. Vooral als dat op duurzame wijze moet gebeuren.
De KB richt zich op dit moment nog niet eens zozeer op het uitlenen van digitale content. Het primaire belang op dit moment is het verkrijgen, opslaan en rubriceren van digitale content, om te komen tot een digitale collectie die wellicht op termijn opengesteld zal worden voor het publiek.
Maar wat moet er gearchiveerd worden? Het ligt voor de hand om van elk boek dat op papier verschijnt ook een digitale (pdf) versie te archiveren. Maar wat te doen met boeken die ‘born digital’ zijn en misschien helemaal geen papieren evenknie kennen? Als deze een eigen ISBN hebben dan is deze vraag misschien snel beantwoord, maar wat te doen met de toenemende stroom digitale publicaties die geen ISBN hebben?
Dan is er nog de formatenkwestie. Op dit moment is het speelveld misschien redelijk overzichtelijk, met pdf en ePub als gangbare ebookformaten. Maar wat nu als Amazon - met weer een eigen ebookformaat - een Nederlandse winkel opent? En als Blio doorbreekt? Copia? Of Kobo? Moeten deze ebooks ook gearchiveerd worden, en zo ja, hoe kunnen de verschillende formaten ook in de toekomst geopend en gelezen worden? Om over multimedia ebook apps zoals je die nu ziet op de iPad nog niet te spreken; als dit technisch al gearchiveerd kan worden, is er nog het probleem van de rechten, helemaal bij ‘enhanced ebooks’ of ebooks die deels bestaan uit user generated content.
Vervolgens rijst de vraag hoe om te gaan met (academische) boeken die zowel in pdf als in een reflowable formaat (zoals ePub) verschijnen. Want hoe moet er in de toekomst geciteerd worden? Een reflowable ebook kent immers geen vaste paginering. Als een wetenschapper verwijst naar een citaat op pagina x van een digitale publicatie, kan dat dan alleen naar een pdf uitvoering? Maar wat als die er niet is?
Ook het fenomeen ‘herdruk’ is niet meer relevant bij ebooks. Eén van de grote voordelen van ebooks is immers dat deze onbeperkt geupdate kunnen worden. Maar naar welke versie moet je dan verwijzen, als je een referentie opneemt naar een digitaal boek? Moet de KB van elke nieuwe update een digitale versie op gaan slaan, en zo ja, wie gaat dit bijhouden?
Vragen te over dus, en dan hebben we het nog niet eens gehad over het openbaar beschikbaar maken van de content, wat ook weer allerlei zakelijke en technologische voeten in de aarde heeft. Een lastig dilemma, waar niet eenvoudig een oplossing voor te bedenken valt. Ik prijs daarom de pragmatische aanpak die de KB op dit moment voorstaat, namelijk zo goed en kwaad als het gaat beginnen met collectievorming, en pas in een later stadium bekijken of en hoe de gearchiveerde content breder ontsloten kan worden.