Օպտիկական նիշերի ճանաչումը (OCR) վերաբերում է ծրագրային ապահովմանը, որը ստեղծում է տպագիր, տպագրված կամ ձեռագիր փաստաթղթի թվային տարբերակ, որը համակարգիչները կարող են կարդալ `առանց ձեռքի մուտքագրելու կամ մուտքագրելու անհրաժեշտության մասին: OCR- ը սովորաբար օգտագործվում է սկանավորվող փաստաթղթերում PDF ֆորմատով, բայց կարող է ստեղծել նաեւ պատկերների ֆայլի համակարգչային ընթեռնելի տարբերակ:
Ինչ է OCR- ն:
OCR- ը նաեւ կոչվում է տեքստի ճանաչում, որը ծրագրային տեխնոլոգիա է, որը փոխակերպում է այնպիսի կերպարներ, ինչպիսիք են թվերը, տառերը եւ կետադրականությունը (նաեւ կոչվում են glyphs) տպագիր կամ գրավոր փաստաթղթերից էլեկտրոնային ձեւով ավելի հեշտությամբ ճանաչված եւ կարդացված համակարգիչներ եւ այլ ծրագրային ծրագրեր: Որոշ OCR ծրագրեր դա անում են, քանի որ փաստաթուղթը սկանավորվում է կամ լուսանկարվում է թվային ֆոտոխցիկով, եւ մյուսները կարող են այս գործընթացը կիրառել այն փաստաթղթերին, որոնք նախկինում սկանավորվել կամ լուսանկարվել են առանց OCR- ի: OCR- ն հնարավորություն է տալիս օգտվողներին փնտրել PDF ֆորմատի փաստաթղթերում, խմբագրել տեքստը եւ վերաձեւակերպել փաստաթղթերը:
Ինչ է օգտագործվում OCR- ի համար:
Արագ, ամեն օր սկանելու կարիքները, OCR- ը չի կարող մեծ գործարք լինել: Եթե դուք մեծ քանակությամբ սկանավորում եք անում, կարող եք փնտրել PDF- ներում, որպեսզի ճշգրիտ գտնեք, կարող եք խնայել միանգամից մի քանի անգամ, եւ OCR ֆունկցիոնալությունը դարձնում է ձեր սկաների ծրագրում ավելի կարեւոր: Ահա մի քանի այլ բաներ, OCR- ն օգնում է.
- Տվյալների ավտոմատացված մշակում եւ տվյալների մուտքագրում (Օրինակ `ռեզյումեների համար աշխատողներին հետեւող համակարգեր)
- Սկանավորված գրքերը որոնելի դարձնելու համար
- Ձեռագրված սկանների փոխարկումը համակարգչային ընթերցման տեքստին
- Ընթերցող ծրագրերի միջոցով փաստաթղթերը ավելի օգտագործելի են դարձնում, որոնք օգնում են տեսողական խնդիրներ ունեցողներին
- Պահպանելով պատմական փաստաթղթեր եւ թերթեր, մինչդեռ դրանք որոնելի են դարձնում
- Տվյալների հեռացում եւ հաշվապահական հաշվառման ծրագրերի փոխանցում (օրինակ `կտրոններ եւ հաշիվ-ապրանքագրեր)
- Ինդեքսավորման փաստաթղթեր, որոնման համակարգերի օգտագործման համար
- Ճանապարհորդի վարորդական վահանակների ճանաչում արագ խցիկի եւ կարմիր լույսի խցիկի ծրագրային ապահովմամբ
- Խոսքի սինթեզատորների համար, ովքեր չեն կարող խոսել, տեսական ֆիզիկոս Սթիվեն Հոքինը, թերեւս, խոսքի սինթեզատոր ծրագրի ամենատարածված օգտագործողն է:
Ինչու օգտագործել OCR- ը:
Ինչու ոչ միայն լուսանկարել, ճիշտ է: Քանի որ դուք չեք կարողանա որեւէ բան խմբագրել կամ որոնել տեքստը, քանի որ դա պարզապես պատկեր է: Փաստաթուղթը սկանավորելու եւ OCR ծրագրային ապահովման առաջադրումը կարող է այդ ֆայլը դարձնել այն, ինչ կարող եք խմբագրել եւ փնտրել:
OCR- ի պատմությունը
Թեեւ տեքստի ճանաչման ամենահեռավոր օգտագործումը սկսվում է մինչեւ 1914 թ.-ը, OCR- ի հետ կապված տեխնոլոգիաների լայնորեն տարածված զարգացումը եւ օգտագործումը սկսվել է 1950-ական թվականներին, մասնավորապես պարզեցված տառատեսակների ստեղծմամբ, որոնք ավելի հեշտ էին փոխանակել թվային ընթերցվող տեքստին: Այս պարզեցված տառատեսակների առաջինը ստեղծվել է Դեյվիդ Շեպարդի կողմից եւ հայտնի է որպես OCR-7B: OCR-7B- ը դեռեւս օգտագործվում է ֆինանսական համակարգում `վարկային քարտերի եւ դեբետային քարտերի համար օգտագործվող ստանդարտ տառատեսակով: 1960-ական թվականներին մի շարք երկրներում փոստային ծառայությունները սկսեցին OCR տեխնոլոգիաները, արագորեն արագացնել փոստարկղը, ներառյալ Միացյալ Նահանգները, Մեծ Բրիտանիան, Կանադան եւ Գերմանիան: OCR- ն դեռեւս փոքրաթիվ տեխնոլոգիան է, որն օգտագործվում է փոստով փոստային ծառայությունների համար: 2000 թ. OCR տեխնոլոգիայի սահմանների եւ հնարավորությունների հիմնական գիտելիքները օգտագործվում էին CAPTCHA ծրագրերի մշակման համար, որոնք օգտագործվում էին բոտերին եւ սպամմերներին դադարեցնելու համար:
Տասնամյակների ընթացքում OCR- ն աճեց ավելի ճշգրիտ եւ ավելի բարդ տեխնոլոգիաներով, ինչպիսիք են արհեստական ինտելեկտը , մեքենայական ուսումը եւ համակարգչային տեսլականը: Այսօր OCR- ի ծրագրային ապահովումը օգտագործում է օրինաչափության ճանաչում, հնարավորության հայտնաբերում եւ տեքստային հանքարդյունաբերություն, ավելի արագ եւ ճշգրիտ փաստաթղթեր վերափոխելու համար: