Skip to main content

Što je prepoznavanje govora?

prepoznavanje govora (Travanj 2025)

prepoznavanje govora (Travanj 2025)
Anonim

Prepoznavanje govora je tehnologija koja omogućuje govorni ulaz u sustave. Razgovarate s računalom, telefonom ili uređajem i upotrebljavate ono što ste rekli kao unos da biste pokrenuli neku radnju. Tehnologija se koristi za zamjenu drugih metoda unosa, poput tipkanja, klikanja ili odabira na druge načine. To je sredstvo za stvaranje uređaja i softvera jednostavnijim za korištenje i povećanju produktivnosti.

Mnogo je primjena i područja u kojima se prepoznavanje govora koristi, uključujući i vojsku, kao pomoć osobama s invaliditetom (zamislite osobu s paraliziranim ili bez ruku ili prstiju), medicinskom polju, robotici itd. U bliskoj budućnosti, gotovo svatko će biti izložen prepoznavanju govora zbog širenja među uobičajenim uređajima poput računala i mobilnih telefona.

Neki pametni telefoni koriste zanimljivu upotrebu prepoznavanja govora. Primjeri toga su iPhone i Android uređaji. Kroz njih možete uputiti poziv kontaktu samo uzimajući izgovorene upute poput "Pozivnica". Također se mogu zabavljati i druge naredbe, kao što je "Uključivanje Bluetootha".

Problemi s prepoznavanjem govora

Prepoznavanje govora, u svojoj verziji poznatoj kao Govor na tekst (STT), također se dugo koristi za prevođenje izgovorenih riječi u tekst. "Vi govorite, to tipovi", kako bi ViaVoice rekao na svojoj kutiji. Ali postoji jedan problem s STT-om kao što znamo. ViaVoice je jedan od najboljih u industriji, pa zamislite ostatak. Tehnologija je sazrela i poboljšala, ali govor u tekstu i dalje postavlja pitanja. Jedna od glavnih poteškoća je velika razlika među ljudima u izgovoru riječi.

Nije prepoznavanje svih jezika u prepoznavanju govora, a oni koji to često ne podržavaju, kao i engleski. Kao rezultat toga, većina uređaja koji rade softver za prepoznavanje govora razumno funkcionira samo na engleskom.

Skup hardverskih zahtjeva čini prepoznavanje govora teško implementirati u određenim slučajevima. Potreban vam je mikrofon koji je dovoljno inteligentan da filtrira pozadinsku buku, ali istodobno dovoljno snažnu za snimanje glasa prirodno.

Govoreći o pozadinskoj buri, može uzrokovati da cijeli sustav propadne. Kao rezultat toga, prepoznavanje govora u mnogim je slučajevima neuspješno zbog buke koje nisu korisničke kontrole.

Prepoznavanje govora pokazalo se bolje kao način unosa za nove telefone i komunikacijske tehnologije kao što je VoIP, nego kao alat za produktivnost za masovni unos teksta.

Primjena prepoznavanja govora

Tehnologija dobiva popularnost u mnogim područjima i uspješna je u sljedećem:

  • Kontrola uređaja, Samo govoreći "OK Google" na telefonu s Androidom pokrećete sustav koji je sve uši vašim glasovnim naredbama.
  • Bluetooth uređaji za automobil, Mnogi automobili opremljeni su sustavom koji povezuje radio mehanizam s vašim smartphoneom putem Bluetootha. Zatim možete upućivati ​​i primati pozive bez dodirivanja pametnog telefona, a čak ih možete nazvati i samo ih izgovarati.
  • Transkripcija glasa, U područjima gdje ljudi moraju puno upisivati, neki inteligentni softver bilježi svoje izgovorene riječi i transkribira ih u tekst. Ovo je trenutno u određenom softveru za obradu teksta. Glas transkripcija također radi s vizualnom govornom poštom.