18-10-09 14:21
Veel van de boeken die Eburon uitgeeft zijn opgenomen in Google Books. Lezers kunnen maximaal 20% van elk boek doorbladeren en doorklikken naar boekwinkels die het boek verkopen. Een slimme student heeft echter ontdekt hoe je in theorie het volledige boek kunt bekijken.
Het artikel waarin ene isometrick uitlegt hoe hij volledig toegang krijgt tot boeken uit het programma stamt al uit maart 2005, en is dus geschreven niet lang nadat het Book Search programma van start ging. Ik weet niet of het mechanisme wat hij beschrijft nog werkt (want niet bepaald eenvoudig uit te testen), maar logisch klinkt het wel.
Wat is het idee: uitgevers kunnen boeken waarop copyright rust uploaden in
Google Book Search. Mensen die op bepaalde woorden zoeken krijgen pagina’s te zien waarop deze woorden voorkomen, en kunnen vervolgens een aantal pagina’s om de zoekterm heen bekijken. De uitgever bepaalt hoeveel pagina’s er maximaal getoond mogen worden. Meestal is dat 20% va het boek. De potentiële lezer krijgt dus een goede indruk van het boek, maar kan nooit het hele boek lezen van zijn scherm.
Google houdt zicht op de pagina’s die zijn bekeken door een klein bestandje weg te schrijven op de pc van de gebruiker, een zogenaamde cookie. In die cookie bevindt zich een datumstempel en een unieke code, die wordt vergeleken met de url van de boekpagina die je bekijkt. De code bevat als het ware een beginpagina en een paginarange die je mag bekijken.
Isometrick
kwam erachter dat door het veranderen van de unieke code in de cookie die hij op zijn pc aantrof, hij na 24 uur ook andere pagina’s uit hetzelfde boek kon bekijken. Door dit proces te automatiseren is het in theorie mogelijk om elk boek waarop uitgevers beperkingen hebben ingesteld toch in zijn geheel te bekijken.
Echt praktisch is de truuk niet, want je kunt de pagina’s niet bewaren op je pc. Je zult dus met screenshots en ocr software moeten gaan werken wil je een ebook genereren dat verder verspreid kan worden. En Google heeft het waarschijnlijk snel door dat een pc achter één ip adres veel meer pagina’s opvraagt dan is toegestaan.
Nogmaals, ik weet niet of deze Google hack nog werkt. Het voorbeeld toont wel aan dat ook Google Books waarschijnlijk niet 100% waterdicht is. De enige manier om te voorkomen dat een gebruiker meer kan zien dan de door de uitgever ingestelde limiet, is door vaste pagina’s uit te sluiten van weergave, maar dan kun je de boeken ook niet meer volledig doorzoeken. Dat tast juist het unieke karakter van de Book Search functie aan.