 
|
|
 |
OCR (Optical Character Recognition) je računalna tehnologija koja omogućuje pretvorbu skeniranih
papirnatih dokumenata, PDF dokumenata i slika dokumenata snimljenih pomoću digitalnog fotoaparata u
formate koji se mogu uređivati.
OCR je osobito koristan kad je potrebno napraviti neke korekcije na papirnatom dokumentu, na primjer na
tekstu ugovora, članku iz časopisa ili letka ili za upotrebu dijela teksta prilikom kreiranja drugog dokumenta.
Upotrebom skenera bez pomoći OCR-a, papirnati dokumenti mogu biti pretvoreni u elektronski oblik kao
digitalne slike. Ipak, dobivanje slike dokumenta ne pomaže u rješavanju problema uređivanja dokumenta ili
pohrane u arhivu koja se može pretraživati. Jedini način da se to učini je prepisivanje dokumenta i stvaranje
identičnog izgleda dokumenta, a to se može učiniti ili ručno ili uz pomoć OCR-a!
OCR raspoznaje sliku originalnog dokumenta i izrađuje elektronsku kopiju koja se može uređivati zadržavajući
izgled dokumenta te omogućava full-text pretragu kroz dokument. Ta elektronska kopija može se uređivati i
spremiti u potreban format kao što su MS Word, MS Excel, HTML, PDF, TXT itd.
Brzina OCR-a impresionira: obrađuje jednu stranicu za nekoliko sekunda, što je 100** puta brže od
profesionalnog daktilografa, a u isto vrijeme radi manje grešaka.

|
|
|
 |