Што е препознавање на говор?

Користење на вашиот глас како метод за внесување

Препознавањето на говор е технологија која овозможува говорно внесување во системи. Разговаравте со вашиот компјутер, телефон или уред и го користи она што го кажавте како влез за да активирате некое дејство. Оваа технологија се користи за замена на други методи на внесување, како што се пишување, кликање или избор на други начини. Тоа е средство да се направат уредите и софтверот поедноставни за корисниците и да се зголеми продуктивноста.

Има многу апликации и области каде што се користи препознавање говор, вклучувајќи ја и војската, како помош за оштетените лица (замислете лице со осакатено или без раце или прсти), на медицинското поле, во роботиката итн. Во блиска иднина, скоро сите ќе бидат изложени на препознавање на говорот поради неговото ширење меѓу заедничките уреди како компјутери и мобилни телефони.

Одредени паметни телефони прават интересна употреба на препознавање на говор. Уредите на iPhone и Android се примери за тоа. Преку нив, можете да започнете повик кон контакт само со добивање на изговорени упатства како што се 'Call office'. Исто така, може да се забавуваат и други команди, како на пример "Вклучете Bluetooth".

Проблеми со препознавање на говор

Препознавањето на говор, во својата верзија позната како Говор за текст (STT), исто така, долго време се користи за преведување на изговорените зборови во текст. "Ти зборуваш, го пишуваш", како што рече Вивиојс на својата кутија. Но, постои еден проблем со СТТ, како што го знаеме. Повеќе од 10 години назад, се обидов ViaVoice и не мина една недела на мојот компјутер. Зошто? Тоа беше грубо неточна и јас завршив трошејќи повеќе време и енергија зборувајќи и коригирање од пишување на сè. ViaVoice е еден од најдобрите во индустријата, па замислете го останатото. Технологијата е созреана и подобрена, но говорот на текст сè уште ги тера луѓето да поставуваат прашања. Една од нејзините главни тешкотии е огромните разлики меѓу луѓето во изговарањето на зборовите.

Не се потребни сите јазици за препознавање на говор, а оние кои често не се поддржани, како и англиски. Како резултат на тоа, повеќето уреди што го водат софтверот за препознавање на говор ги прават разумно само со англиски јазик.

Собата на хардверски барања го отежнува распоредувањето на говорот во одредени случаи. Ви треба микрофон кој е доволно интелигентен за филтрирање на бучава во позадина, но во исто време доволно моќен за да го фати гласот природно.

Зборувајќи за бучавата во позадина, може да предизвика целосен систем да пропадне. Како резултат на тоа, препознавањето на говор во многу случаи не успее поради звуците кои се надвор од контролата на корисникот.

Препознавањето на говор се покажува како подобар метод за внесување на нови телефони и комуникациски технологии како VoIP, отколку како алатка за продуктивност за внесување на големи букви.

Апликации за препознавање на говор

Технологијата се здобива со популарност во многу области и е успешна во следното:

- Контрола на уредот. Велејќи дека "ОК Гугл" на телефон со Андроид се активира систем кој е сите уши за вашите гласовни команди.

- Автомобили со Bluetooth системи. Многу автомобили се опремени со систем кој го поврзува својот радио-механизам со вашиот паметен телефон преку Bluetooth. Потоа можете да остварувате и примате повици без да го допирате вашиот паметен телефон, па дури можете да бирате броеви само со тоа да ги кажете.

- Гласовна транскрипција. Во области каде што луѓето треба да напишат многу, некои интелигентни софтверски ги доловуваат нивните изговорени зборови и ги препишуваат во текст. Ова е тековно во одреден софтвер за обработка на текст. Гласовна транскрипција исто така работи со визуелна говорна пошта .