OCR

Was versteht man unter OCR?

OCR steht als Kürzel für „Optical Character Recognition“, was auf Deutsch schlicht als automatische Texterkennung bezeichnet wird. Heute umfasst OCR auch die ICR-Technologie. Das Kürzel steht für „Intelligent Character Recognition“ und bedeutet, dass bei der Umwandlung auch die Informationen im Kontext mit beachtet werden. So kann die Qualität der Texterkennung deutlich gesteigert werden. Beim Scannen werden die einzelnen Pixel abgetastet. Ihre Anordnung wird durch die OCR-Software mit den Informationen in einer Datenbank abgeglichen und nach Übereinstimmungen gesucht. Gibt es keine hundertprozentige Übereinstimmung, wird das Element genommen, das der Anordnung der Pixel am meisten entspricht. Anschließend erfolgt eine Korrektur auf Zeichenebene und anschließend auf Wortebene durch einen Abgleich mit hinterlegten Wörterbüchern. Darüber hinaus können in vielen Versionen der OCR-Software manuelle Korrekturen vorgenommen werden. OCR-Software gibt es meistens als Bundle zum Scanner oder als Druckerzubehör zum Multifunktionsgerät dazu. Bei den MFP spielt es bei den Bundles keine Rolle, ob das Druckwerk Toner benötigt oder Tinte tröpfchenweise zu Papier bringt. Lediglich auf die Qualität der Scaneinheit kommt es bei der Zusammenarbeit mit der OCR-Software an.