Ինչ է խոսքի ճանաչումը:

Օգտագործելով ձեր ձայնը որպես ներածման մեթոդ

Խոսքի ճանաչումը այն տեխնոլոգիան է, որը թույլ է տալիս խոսել ներդրումների համակարգում: Դուք խոսում եք ձեր համակարգչի, հեռախոսի կամ սարքի հետ, եւ այն օգտագործում է այն, ինչ ձեր ասելիքն է, որպես գործողության խթանման համար: Տեխնոլոգիան օգտագործվում է ներածման այլ մեթոդների փոխարինման համար, օրինակ `մուտքագրելով, սեղմելով կամ ընտրելով այլ եղանակներով: Այն սարքերի եւ ծրագրերի համար առավել հարմարավետ դարձնելու եւ արտադրողականության բարձրացման միջոց է:

Բազմաթիվ դիմումներ եւ տարածքներ կան, որտեղ խոսքի ճանաչումն օգտագործվում է, այդ թվում `զինված ուժերը, որպես խանգարված անձանց օգնության (պատկերացրեք հաշմանդամ կամ ոչ ձեռքերով կամ մատներով), բժշկական ոլորտում, ռոբոտների եւ այլն: Մոտ ապագայում, գրեթե բոլորը պետք է ենթարկվեն խոսքի ճանաչման, քանի որ այն տարածվում է համակարգիչների եւ բջջային հեռախոսների տարածման մեջ:

Որոշ սմարթֆոններ խոսքի ճանաչման հետաքրքիր օգտագործում են: IPhone- ի եւ Android սարքերի օրինակները: Դրանց միջոցով Դուք կարող եք զանգահարել կոնտակտին, պարզապես ստանալով «Զանգի գրասենյակ» կարգախոսը: Այլ հրամանները կարող են նաեւ դիտվել որպես «Միացնել Bluetooth- ը»:

Խոսքի ճանաչման հետ կապված խնդիրներ

Խոսքի ճանաչումը, իր ելույթում, որը հայտնի է որպես «Խոսքի տեքստ» (STT), նույնպես օգտագործվել է երկար ժամանակ տեքստեր թարգմանելու համար: «Դու խոսում ես, տեսնում ես», քանի որ ViaVoice- ը իր վանդակում ասում էր: Սակայն STT- ի հետ մեկ խնդիր կա, քանի որ մենք գիտենք դա: Ավելի քան 10 տարի անց, ես փորձեցի ViaVoice- ը եւ շաբաթը մեկ անգամ չէր անցել իմ համակարգչում: Ինչու: Դա կոպիտ սխալ է եւ ես ավարտեցի ավելի շատ ժամանակ եւ էներգիա խոսելու եւ ուղղելու համար, քան ամեն ինչ գրել: ViaVoice- ը լավագույններից մեկն է, այնպես որ պատկերացրեք մնացածը: Տեխնոլոգիան հասունացել եւ բարելավվել է, սակայն տեքստի ելույթը դեռեւս մարդկանց հարցնում է: Նրա հիմնական դժվարություններից մեկն այն է, որ խոսքի բառերի լեզվով խոսող մարդկանց մեջ մեծ տատանումներ են լինում:

Ոչ բոլոր լեզուները ենթադրվում են խոսքի ճանաչում, եւ նրանք, ովքեր անում են, հաճախ չեն աջակցում, ինչպես նաեւ անգլերեն: Արդյունքում, խոսքի ճանաչման ծրագրային ապահովման գործածող սարքերը հիմնականում կատարում են միայն անգլերենով:

Սարքավորման պահանջների մի շարք դարձնում խոսքի ճանաչումը դժվար է որոշ դեպքերում տեղակայել: Ձեզ անհրաժեշտ է միկրոֆոն, որը բավականին խելացի է ֆոնային աղմուկը զսպելու համար, բայց միեւնույն ժամանակ բավականաչափ հզոր է, բնականաբար ձայնը գրավելու համար:

Խոսելով ֆոնային աղմուկի մասին, դա կարող է հանգեցնել ամբողջ համակարգին: Արդյունքում, խոսքի ճանաչումը ձախողվում է շատ դեպքերում `աղմուկի պատճառով, որոնք օգտագործողի վերահսկողությունից դուրս չեն:

Խոսքի ճանաչումը ապացուցում է, որ նոր VoIP- ի նման նոր հեռախոսների եւ հաղորդակցման տեխնոլոգիաների ներդրման եղանակը, քան որպես զանգվածային տեքստի ներդրման արդյունավետության գործիք:

Խոսքի ճանաչման դիմումները

Տեխնոլոգիան շատ տարածված է դառնում բազմաթիվ ոլորտներում եւ հաջողությամբ է անցել հետեւյալը.

- Սարքի վերահսկում: Պարզապես «OK Google» - ը Android հեռախոսի համար հրդեհ է բռնկում ձեր ձայնային հրամանների բոլոր ականջները:

- Car Bluetooth համակարգեր: Շատ մեքենաներ հագեցած են մի համակարգով, որը կապում է ձեր ռադիոհաղորդիչի մեխանիզմը Bluetooth- ի միջոցով: Այնուհետեւ կարող եք կատարել եւ ստանալ զանգեր, առանց սմարթֆոնի հպման, եւ նույնիսկ կարող եք թվեր հավաքել, պարզապես դրանք ասելով:

- Ձայնի արտագրելը: Այն վայրերում, որտեղ մարդիկ շատ բաներ են գրում, որոշ խելացի ծրագրեր գրավում են իրենց խոսքերն ու տեքստը տեքստում: Սա գործում է որոշակի բառերի մշակման ծրագրային ապահովման մեջ: Ձայնագրությունը նաեւ աշխատում է ձայնային փոստով :