Es handelt sich um eine Technologie, die dazu dient, gedruckten oder handgeschriebenen Text von physischen oder digitalen Dokumenten in maschinenlesbaren Text umzuwandeln.
Das OCR-Verfahren ermöglicht es also, Bilder oder gescannte Dokumente zu analysieren und den darin enthaltenen Text zu erkennen und zu extrahieren. Die erkannten Zeichen werden in einen digitalen Text umgewandelt, der dann durchsucht, bearbeitet oder in eine andere Anwendung eingefügt werden kann.