Uitgeverij Eburon
Uitgever 2.0
Uitgever 2.0: uitgeverij blog van Wiebe de Jager'Uitgever 2.0' is het bedrijfsblog van Eburon-uitgever Wiebe de Jager, over de ontwikkelingen in uitgeefland en de toekomst van het boek.
Bekijk recente berichten

Uitgever 2.0 blog rss feed  

Boeken die ik geschreven heb:
Affiliate marketing
Bevorder je boekverkoop
Publiceren op de iPad
Zelf ebooks uitgeven

Mijn volgende boek:
CERN (science fiction thriller)

Zoeken
Doorzoek onze site op auteur, titel, trefwoord of isbn (isbn zonder streepjes of spaties invoeren):
Gratis email service

Nieuwe berichten van dit weblog automatisch in uw inbox ontvangen? Voer daartoe hieronder uw emailadres in. Aanmelden is gratis!

Ebook ergernissen #8: OCR-fouten

Wiebe de Jager
Ebook ergernissen #8: OCR-fouten

Vooral bij oudere uitgaven die digitaal worden aangeboden kom je nog wel eens zeer vreemd gespelde woorden en overbodige of juist ontbrekende leestekens tegen. Grote kans dat het om OCR-fouten gaat, die in het ebook zijn geslopen nadat een fysiek boek is gescand omdat er geen digitale bestanden voorhanden waren.

Een mooi opgemaakt en technisch correct ebook maken is moeilijker dan menigeen denkt. Veel ebooks van zowel doe-het-zelvende auteurs als professionele uitgevers bevatten dan ook storende fouten. Maar ook andere factoren kunnen het digitale leesplezier negatief beïnvloeden. In de reeks ‘ebook ergernissen’ zet ik de 10 meest voorkomende ongemakken op een rij. Ergernis nummer acht zijn OCR-fouten in ebooks.

Door middel van Optical Character Recognition (OCR) kun je pagina’s met gescande tekst omzetten naar door computers leesbare karakters. De techniek wordt mede gebruikt om oudere boeken nieuw leven in te blazen, als ebook. Helaas is OCR verre van perfect en een tekst moet dan ook altijd goed nagekeken worden, nadat deze is herkend.

Vooral bij Google Books zijn er veel digitale boeken te vinden die wemelen van de OCR-fouten. Veelal zijn dit boeken waarvan het auteursrecht verlopen is en die in het kader van het bibliotheekproject gescand zijn en vervolgens als ebook beschikbaar gemaakt worden via books.google.com.

Op zich is het prijzenswaardig dat het bedrijf zich inzet om oude kennis digitaal beschikbaar te maken. Maar als deze in de praktijk zo goed als onleesbaar blijken te zijn doordat de automatische herkenning van teksten niet feilloos verloopt, dan kun je je afvragen of de inspanningen opwegen tegen de resultaten.

Ook in commercieel verkrijgbare ebooks zie je soms OCR-fouten staan. Bij de gedachte aan het digitaal ontsluiten van de backlist gaat menig uitgevershart sneller kloppen, maar vergeet niet dat ook hier een kwaliteitscontrole wenselijk is.

Volgende ergernis: onleesbare afbeeldingen

Vorige ergernis: windowing



   



Boeken printen in de winkel
De Espresso Book Machine maakt het mogelijk om boeken op bestelling te printen in een winkel of bibliotheek.
 

Uitgever 2.0   
Hypermedia: het klinkt als een uitgeefvorm uit een science fictionfilm, maar in feite kennen we het allemaal in de vorm van het web. Documenten, paragrafen of alinea’s staan in een hypermediasysteem niet lineair achter elkaar, maar de lezer kiest zelf zijn weg door te klikken op hyperlinks. Het risico bestaat echter dat de gebruiker de draad kwijtraakt. Daar heeft een Eindhovense promovendus iets op gevonden.  Lees meer...Lees meer...
Vorige week vond onze ‘Eburon over 5 jaar’ brainstorm plaats. Eén van de dingen die tijdens die brainstorm opgemerkt werd was dat bij het uitgeven van een boek ‘er altijd wel ergens zand tussen de wielen komt’. Iedereen die denkt dat uitgeven een kwestie van ‘een druk op de knop’ wordt (of is), die slaat de plank flink mis.  Lees meer...Lees meer...
Vrijdag de 20e april zitten de Eburonen ‘een dagje op de hei’ om na te denken over onze korte- tot middellangetermijnstrategie. Het thema is ‘Eburon over 5 jaar’. Welke ontwikkelingen zijn er gaande in het uitgeefvak, en hoe kunnen we daar op inspelen? Wat zijn onze sterke punten? En waar moeten we aan werken? We kunnen natuurlijk van alles zelf gaan verzinnen, maar we zijn vooral benieuwd naar jouw ideeën en feedback!  Lees meer...Lees meer...
-->
PHP CMS by ViArt Ltd