Што е оптичко препознавање знаци (OCR)?

Оптичко препознавање знаци (OCR) се однесува на софтвер кој создава дигитална верзија на печатен, напишан или рачно напишан документ што компјутерите можат да го прочитаат без потреба рачно да го пишувате или внесувате текстот. OCR генерално се користи на скенирани документи во PDF формат, но исто така може да создаде верзија на текст што се чита во компјутер во рамките на датотеката со слики.

Што е OCR?

OCR, исто така познат како препознавање на текст, е софтверска технологија која лесно се препознава и чита од компјутерите и другите софтверски програми, како што се броеви, букви и интерпункциски знаци (исто така наречени хиероглифи) од печатени или пишани документи во електронска форма. Некои програми за OCR го прават тоа како документ се скенира или фотографира со дигитална камера, а други можат да го применат овој процес на документи кои биле претходно скенирани или фотографирани без OCR. OCR им овозможува на корисниците да пребаруваат во PDF документи, да уредуваат текст и да ги преформулираат документите.

Што се користи OCR?

За брзо, секојдневно скенирање потреби, OCR не може да биде голема работа. Ако направите голема количина на скенирање, да бидете во можност да пребарувате во рамките на PDF датотеки за да го пронајдете точното што ви треба, можете да заштедите доста време и да направите OCR функционалност во вашата програма за скенирање поважна. Еве некои други нешта OCR помага со:

Зошто да го користите OCR?

Зошто не само да сликате, нели? Бидејќи нема да можете да уредувате ништо или да го пребарувате текстот, бидејќи тоа само ќе биде слика. Скенирање на документот и водење на OCR софтверот може да ја претворат таа датотека во нешто што можете да го уредите и да можете да пребарувате.

Историја на OCR

Додека најраната употреба на препознавање на текстови датира од 1914 година, широко распространетиот развој и употреба на технологиите поврзани со OCR започнаа во 1950-тите години, особено со создавањето на многу поедноставни фонтови кои беа полесни за конвертирање во дигитално-читлив текст. Првиот од овие поедноставени фонтови беше создаден од Дејвид Шепард и попозната како OCR-7B. OCR-7B се уште е во употреба денес во финансиската индустрија за стандардниот фонт кој се користи на кредитни картички и дебитни картички. Во 1960-тите, поштенските услуги во неколку земји почнаа да ја користат OCR технологијата за да го забрза сортирањето пошта, вклучувајќи ги САД, Велика Британија, Канада и Германија. OCR се уште е основната технологија што се користи за сортирање на пошта за поштенски услуги низ целиот свет. Во 2000 година клучните познавања за границите и можностите на OCR технологијата беа искористени за развивање на CAPTCHA програмите кои се користат за запирање на ботови и спамери.

Во текот на децении, OCR стана повеќе точни и пософистицирани поради напредокот во сродни технолошки области како што се вештачка интелигенција , машинско учење и компјутерска визија. Денес, софтверот OCR користи препознавање на карти, функција за откривање и рударство на текстови за да ги трансформира документите побрзо и попрецизно од кога било досега.