13-08-08 10:00
De Europese Commissie wil vaart maken met het digitaal conserveren van ons culturele erfgoed. Om de lidstaten te stimuleren om boeken, schilderijen, foto's en muziek online beschikbaar te maken is er alvast een centrale digitale bibliotheek opgericht onder de naam "Europeana".
Volgens de EC worden er in de lidstaten meer dan 2,5 miljard boeken bewaard, waarvan slechts één procent kan worden opgevraagd in digitale vorm. Om dat te veranderen moet er een grote Europese digitale bibliotheek komen. De bedoeling is dat naast boeken ook muziek, schilderijen, foto's en films digitaal beschikbaar gesteld worden, in één portaal.
Ook al boeken de lidstaten 'significante vooruitgang' met het online beschikbaar maken van cultureel erfgoed zijn er volgens Eurocommissaris Viviane Reding meer investeringen nodig, zowel van de overheid als uit de private sector. Reding hoopt de bibliotheek in november 2008 te openen.
Kostbaar
Momenteel is er 120 miljoen euro beschikbaar voor het project, maar volgens de EC is er nog veel meer geld nodig. De totale kosten voor het digitaliseren van vijf miljoen boeken worden geschat op 225 miljoen euro. Dan zijn de manuscripten en schilderijen nog niet meegerekend.
Het probleem is dat het inscannen van oude boeken nog niet zo gemakkelijk is. Je kunt iemand achter een glasplaat scanner zetten, die dan pagina voor pagina het boek inscant. Maar dat duurt lang en is dus kostbaar. Daar komt dan nog extra tijd bij voor het corrigeren van OCR bestanden (automatische tekstherkenning).
Je kunt een boek ook opsturen naar de Filippijnen, waar het door typisten bladzijde voor bladzijde wordt overgetypt. Dat schijnt heel goed te gaan, ook al begrijpen ze natuurlijk helemaal niets van wat ze lezen. Maar ook al zijn de arbeidskosten laag, het is nog altijd duurder dan bovenstaande optie.
Een andere oplossing is om de rug van de boeken af te snijden en de losse pagina’s automatisch te scannen. Dat gaat veel sneller, alleen: het boek is dan definitief kapot. En dat is erg vervelend als je als bibliotheek maar één exemplaar van het betreffende boek hebt. Dan doet de vraag zich voor wat belangrijker is: de inhoud van een boek vindbaar maken op internet, of het boek als artefact conserveren en voor lief nemen dat niemand ernaar vraagt.
Obstakels
Tot nu toe werd er alleen op kleine schaal gedigitaliseerd. Bovendien is er een wildgroei aan opslagsystemen en bestandsformaten. De EC wil daarom een aantal standaarden doorvoeren zodat de informatie voor iedereen en op soortgelijke wijze beschikbaar kan worden gemaakt.
Problematisch is echter het werk waarop auteursrecht rust. Vooral de zogenaamde 'orphan works', waarvan de rechthebbenden niet te achterhalen zijn, vormen een obstakel voor het digitaliseringsproject. Commerciële digitaliseringsprojecten, zoals Google Book Search, hadden eerder ook al met soortgelijke problemen te maken.