Wat is optiese karakterherkenning (OCR)?

Optiese karakterherkenning (OCR) verwys na sagteware wat 'n digitale weergawe van 'n gedrukte, getikte of handgeskrewe dokument skep wat rekenaars kan lees sonder om die teks handmatig te tik of in te voer. OCR word gewoonlik in geskandeerde dokumente in PDF- formaat gebruik, maar kan ook 'n rekenaar leesbare weergawe van teks binne 'n prentlêer skep.

Wat is OCR?

OCR, ook bekend as teksherkenning, is sagteware tegnologie wat karakters soos getalle, briewe en punktuasie (ook genoem gliewe) van gedrukte of geskrewe dokumente omskep in 'n elektroniese vorm wat makliker herken en gelees word deur rekenaars en ander sagteware programme. Sommige OCR-programme doen dit as 'n dokument met 'n digitale kamera geskandeer of gefotografeer word. Ander kan hierdie proses toepas op dokumente wat voorheen sonder OCR geskandeer of gefotografeer is. OCR laat gebruikers toe om binne PDF-dokumente te soek, teks te redigeer en dokumente te herformateer.

Waarvoor word OCR gebruik vir?

Vir 'n vinnige, elke dag skandering behoeftes, OCR kan nie 'n groot deal. As jy 'n groot hoeveelheid skandering doen, kan jy binne PDF's soek om die presiese een te vind wat jy benodig, wat redelik tyd kan bespaar, en maak OCR-funksionaliteit in jou skandeerderprogram belangriker. Hier is 'n paar ander dinge wat OCR help met:

Hoekom gebruik OCR?

Hoekom nie net 'n foto neem nie, reg? Omdat jy nie iets kon wysig of die teks kon soek nie omdat dit net 'n prent sou wees. Skandeer die dokument en hardloop OCR-sagteware kan daardie lêer verander in iets wat u kan wysig en kan soek.

Geskiedenis van OCR

Alhoewel die vroegste gebruik van teksherkenningsdatums tot 1914 die wye verspreiding en gebruik van OCR-verwante tegnologieë in die 1950's ernstig begin het, spesifiek met die skep van baie vereenvoudigde lettertipes wat makliker kon omskep in digitaal leesbare teks. Die eerste van hierdie vereenvoudigde lettertipes is geskep deur David Shepard en algemeen bekend as OCR-7B. OCR-7B word vandag nog in gebruik in die finansiële bedryf vir die standaard lettertipe wat op kredietkaarte en debietkaarte gebruik word. In die 1960's het posdienste in verskeie lande begin met die gebruik van OCR-tegnologie om e-pos sorteer vinnig te bespoedig, insluitende die Verenigde State, Groot-Brittanje, Kanada en Duitsland. OCR is steeds die kerntegnologie wat gebruik word om pos vir posdienste regoor die wêreld te sorteer. In 2000 is belangrike kennis van die grense en vermoëns van OCR-tegnologie gebruik om die CAPTCHA-programme te ontwikkel wat gebruik word om bots en spammers te stop.

Oor die dekades het OCR meer akkuraat en meer gesofistikeerd gegroei as gevolg van vooruitgang in verwante tegnologiegebiede soos kunsmatige intelligensie , masjienleer en rekenaarvisie. Vandag gebruik OCR-sagteware patroonherkenning, funksie-opsporing en teksmynbou om dokumente vinniger en meer akkuraat as ooit tevore te transformeer.