Optické rozpoznávání znaků

OCR algoritmus, detekce hran

Optické rozpoznávání znaků či OCR (z anglického Optical Character Recognition) je metoda, která pomocí scanneru umožňuje digitalizaci tištěných textů, s nimiž pak lze pracovat jako s normálním počítačovým textem. Počítačový program převádí obraz buď automaticky, nebo se musí naučit rozpoznávat znaky. Převedený text je téměř vždy v závislosti na kvalitě předlohy třeba podrobit důkladné korektuře, protože OCR program nemusí rozeznat všechna písmena správně. OCR – zpracování textu z tištěné do elektronické podoby je použitelné pro všechny tištěné výstupy z laserových, inkoustových, termosublimačních a jehličkových tiskáren a samozřejmě pro předlohy vytištěné knihtiskem. U nevhodných předloh, např. slabě vytištěných jehličkových výtisků nebo dohromady slitých písmen, se z časového hlediska vyplatí spíše přepis textu.

Pro snadné rozpoznávání znaků byly vyvinuty strojově čitelné fonty, např. OCR-A, nebo dnes používanější OCR-B.

OCR software

JménoLicenceOperační systémPoznámky
ABBYY FineReader OCRKomerčníMicrosoft Windows Vista, Microsoft Windows Server 2003, Windows XP, Windows 2000 (SP2)..
Adobe AcrobatKomerčníWindows, macOS
PDF-XChange ViewerFreewareWindows
PDF-XChange Viewer ProKomerčníWindows
GOCRGPL(open source)
Microsoft Office Document ImagingKomerčníWindows, macOS
NovoDynamics VERUSKomerční??
OcradGPLUnix-like, OS/2
OCRopusApacheLinux
OmniPageKomerční (Nuance EULA)WindowsProdukt Nuance Communications
ReadirisKomerčníWindows, Mac OSProdukt I.R.I.S.
ReadSoftKomerční?
SimpleOCRFreeware a komerčníWindows
SmartScoreKomerčníWindows, Mac
TesseractApacheWindows, macOS, Linux, OS/2Vyvíjeno Googlem
Nicomsoft OCRKomerčníWindows, Linux

OCR rozpoznávající ručně psané znaky

Koncem 60. let 20. století byly v Japonsku vyvinuty OCR systémy rozeznávající i rukou psané znaky, především číslice (poštovní směrovací čísla).[1] Zařízení různých výrobců, ve kterých jsou tato OCR integrována, slouží v poštovním provozu k automatickému třídění dopisů.[2]

Reference

  1. World's First Mail Processing Equipment [online]. Kawasaki, JP: Toshiba Science Museum [cit. 2023-08-19]. Dostupné online. (anglicky) 
  2. VESELÝ, Milan. Systémy třídění se zaměřením na třídění poštovních zásilek na třídicích strojích. České Budějovice, 2016. Bakalářská práce. Jihočeská univerzita. Vedoucí práce Bedřich Veselý. Dostupné online. Archivováno 19. 8. 2023 na Wayback Machine.

Externí odkazy

Média použitá na této stránce

Corner.png
Photograph taken by author and output of algorithm written by author using Matlab programming language.