OCR Workshop for UGent Researchers

Heeft u afbeeldingen van gedrukte bronnen die u doorzoekbaar wilt maken of wilt omzetten naar full-text?

GhentCDH zal een OCR workshop geven waar u kunt leren om van foto's naar bruikbare tekst te maken. Dit zal geven worden op donderdag 30 mei op T2, Lokaal 2.13, om 13 t/m 15u. Optical Character Recognition, kortweg OCR, is het proces waarbij afbeeldingen (bv. scans van boeken) omgezet worden naar tekst die bewerkt kan worden op computers. In de workshop OCR wordt aan de slag gegaan met de open-source tool Tesseract-OCR om dit doel te bereiken. Er wordt aandacht besteed aan het volledige OCR-proces, waarbij we ook de kwaliteit van afbeeldingen verhogen om zo de resultaten te maximaliseren. Na deze workshop wordt het mogelijk om zelf van foto's naar bruikbare tekst en doorzoekbare PDF's te gaan.

Registratie is verplicht en beperk tot 10 personen: https://event.ugent.be/registration/OCRworkshop.