20-02-08 11:00
Er zijn vele commissies die discussiëren over de noodzaak van het digitaliseren en online ontsluiten van boeken, maar vaak blijft het bij voornemens en plannen. Taalcolumnist Ewoud Sanders was het wachten beu en startte zelf een digitaliseringproject. In hoog tempo creëert hij een omvangrijke digitale bronnenbibliotheek van de Nederlandse taal.
Sanders beschikt over een uitgebreide collectie van taalkundige werken en encyclopedieën, die hij in de loop van ruim 20 jaar bij elkaar bracht. Een deel van de boeken uit die collectie is ontdaan van de rug en geautomatiseerd gescand, waarbij via optical character recognition (ocr) de pagina’s niet alleen als gescande afbeeldingen, maar ook als tekst beschikbaar komen. Daardoor worden de gedigitaliseerde boeken doorzoekbaar.
Het digitale archief maakt het mogelijk om bijvoorbeeld in één keer een serie spreekwoordenboeken te doorzoeken op een bepaalde strofe. Zo kun je zien hoe een bepaald spreekwoord is ontstaan of dat auteurs elkaar veelvuldig overschrijven. Sanders: “Zo bevorder je de ongezochte vondst.”
Het is een unicum dat een dergelijk project door een individu wordt uitgevoerd. Eerder al opperde Hans Jansen van de Koninklijke Bibliotheek het idee om een serie boeken van hun rug te ontdoen om ze vervolgens te kunnen scannen, maar dat idee leidde tot veel verontwaardigde reacties.
‘Kapitaalvernietiging’, vonden veel bibliothecarissen. Maar Jansen is een andere mening toegedaan: “Ach, een boek is ook maar een informatiedrager. Het gaat toch om de inhoud?”
(Dit artikel is een verkorte weergave van een interview met Ewoud Sanders in InCT, februari 2008)