OCR
(engl. für Optical Character Recognition = Optische Zeichenerkennung) Bei Projekten der Retrodigitalisierung von Textdokumenten wird häufig eine Texterfassung durchgeführt. OCR-Software erkennt automatisch Texte in den gescannten oder fotografierten Seiten und wandelt sie durch Mustervergleich oder Merkmalanalyse in ASCII-Text um. Damit werden die Texte durchsuchbar und können indiziert werden. Bedingung für den erfolgreichen Einsatz einer OCR-Lösung ist eine gute Qualität der Bilddatei und eine von der OCR-Software erkennbare Schriftart.