MojAndroid

Hlasové príkazy neprišli samé od seba a ani ich nik len tak nevymyslel. Sú pokračovaním obrovsky rastúceho technologického pokroku, ktorý stanovili netradične mobilné zariadenia a nie počítače. Google Voice Search či hlasový asistent Siri sú v technologickom svete už dlhšiu dobu a každý z nás, vrátane gigantov, akými sú Steve Wozniak či Bill Gates, sa zhodne na tom, že to je budúcnosť toho, ako budeme pracovať so svojimi mobilnými zariadeniami. Hlasoví asistenti v našich zariadeniach majú obrovský potenciál do budúcnosti, čo sa prejavuje aj ich neustálym zdokonalovaním. Prečo je však tomu tak?!

Google-Search-vs-Siri

Google Voice Search pracuje ako mozog na vzdialených počítačoch. Mozgom a jeho neurónmi sa nechali inšpirovať aj jeho autori, keď tento systém implementovali do Android zariadení. Pre zariadenia s Androidom 4.1 Jelly Bean a novšie je dostupná aktualizovaná verzia Google Voice Search, ktorá ponúka až o 25% menej chýb v rozpoznávaní reči. Na margo tejto veci sa vyjadril výskumný vedec a vedúci projektu Voice Search v spoločnosti Google - Vincent Vanhoucke:

"Google Voice Search je tak trocha ako prekvapenie - spravili sme ho lepším len tým, že sme zmenili jeho model. Nová verzia Voice Search ponúka o 25% lepšie rozpoznávanie hlasu, čo pre ľudí znamená pohodlnejšie používanie hlasových príkazov. Prvým výsledkom našej práce je napríklad fakt, že ľudia do svojich zariadení hovoria viac prirodzeným dialektom, než ako keby rozprávali do robota, ktorý rozumie len "čistému" dialektu. Určite to mení spôsob, akým ľudia používajú svoje zariadenia..."

Jelly-Bean-Google-Voice-Search

Vanhoucke verejnosti prezradil aj to, ako funguje spracovanie hlasového príkazu vo vašom Android zariadení:

"Hlasový záznam sa v momente nahrávania rozdelí na niekoľko častí, ktoré sa následne pošlú v okamihu do 8 vzdialených super-počítačov firmy Google. Tu sú následne príkazy spracované v špeciálne navrhnutej sieti, ktorá má rovnakú štruktúru a správanie, ako váš mozog, a do niekoľkých mikrosekúnd je informácia späť vo vašom zariadení, pripravená na vykonanie akcie."

SONY DSC

Vďaka obrovskej procesorovej sile počítačov v laboratóriách spoločnosti Google môžu systémy spracovať v sekunde tony vzorových hlasových príkazov a predpovedať ďalšie z príkazov v priebehu krátkeho okamihu. Presne tak, ako to robia aj neuróny vo vašom mozgu. To umožňuje rýchlejšie, presnejšie a cielenejšie dokončovanie úloh na základe vašich hlasových príkazov. Existuje niekoľko vrstiev spracovania hlasovej nahrávky - prvá vrstva sa snaží rozpoznať všetky slová, ktoré ste povedali, pričom základným kameňom je tu každá vyslovená spoluhláska a samohláska. Druhá vrstva následne predpovedá, aké slovo by vo vašom príkaze mohlo nasledovať, čo opätovne pomôže prvej vrstve s jeho spracovaním a takto to ide ďalej do ďalších vrstiev.

google-apps

Celý systém spracovania hlasového príkazu je naozaj fascinujúci. Funguje podľa presnej logiky a dokáže spracovať milióny príkazov v jednej sekunde, nech ste kdekoľvek na svete. Hoci sa vám zdá, že s hlasovým asistentom prišla ako prvá spoločnosť Apple so svojim Sirim, základy tejto technológie nájdete vo fabrikách a laboratóriách spoločnosti Google. Tá si myslí, že, citujeme:

"V hlasovom vyhľadávaní je ešte veľa práce, ktorá musí byť spravená. Od tejto technológie si však v budúcnosti veľa sľubujeme a veríme, že dokáže odstrániť hlasovú bariéru medzi všetkými ľuďmi na svete. Rozpoznávanie hlasu zmení svet k lepšiemu...".

Všetci spoločnosti Google a jej výskumníkom pri ďalšej práci s rozpoznávaním hlasu určite držíme palce a tešíme sa na to, čo si pre nás Google pripraví v ďalších aktualizáciách svojej technológie. V hlasovom ovládaní je rozhodne budúcnosť modernej techniky a pevne veríme, že Google bude kľúčovým hráčom pri jej budovaní.

Zdroj: Wired

19.2.2013

Pravidlá diskusie

Portál MojAndroid.sk si vyhradzuje právo zmazať neslušné, rasistické a vulgárne príspevky, ako aj osobné útoky na redakciu, či diskutérov v komentároch pod článkom bez ďalšieho upozornenia. V prípade uverejňovania odkazov na externé stránky, je komentár automaticky preposlaný do redakcie na schválenie.

16 odpovedí na “Tajomstvo Google Voice Search: Funguje ako mozog cez vzdialené počítače”

  1. pointa toho celeho je, aby vedeli rozoznavat o com sa ludia rozpravaju pocas telefonatu a na zaklade toho im poskytovat reklamu… proste fakt vediet vsetko vsetko vsetko o uzivateloch… Niekde by to uz asi mohlo aj skoncit….

    • Takmer pod každým článkom takéhoto typu sa nájde komentár takéhoto typu. Síce nie som úplný zavrhovatel konspiracii, ale niektorý to už trochu preháňajú a všade vidia pavúky, ktoré chystajú inváziu na Zem ;-).

      • takto no, ja normalne tiez nemam rad konspiracne teorie a nechcem tvrdit, ze to takto bude. Na druhu stranu sa mi idea, ze nejaka sukromna spolocnost o mne vie uplne vsetko a ma pristup k comukolvek co robim nepaci. Netvrdim, ze Google ma o to eminentny zaujem no v principe uz DNES, keby sa Google rozhodol uplne niekomu znicit zivot, tak to dokaze. Nehovorim, ze o to Google ma zaujem, alebo bude mat, ale proste sa mi nepaci ta idea, ze niekto tu moc ma nad nezanedbatelnou castou populacie. To mas ako s atomovymi bombami, ze tiez ich nechcu ani americania a ani rusi pouzivat, ale je to strasiak. Ine krajiny atomky nemaju a preto sa musia viac bat americanov alebo rusov, lebo keby sa im znepacili, tak vybombia krajinu a dana krajina nevie spravit payback. A taka situacia moze prist aj s Google, proste maju v rukach “atomku” a ako strasiak ju mozu kedykolvek pouzit. Urcite nehovorim o konspiraciach a konkretnych planoch a suhlasim, ze take teorie su bullshit, hovorim iba o tom, ze nejaka kontrola pre istotu by byt mala.

  2. Len by bolo fajn keby rozpoznavanie hlasu v Slovencine (ktore ma prekvapilo svojou zatial skvelou presnostou) bolo aj niecim viac ako len naslednym googlenim… Aspon zakladne pokyny pre volanie a podobne by sa zislo – predsalen vytacanie hlasom uz mali aj stare Nokie…

    • na to netreba Google,staci aby sa toho chytil sikovny slovensky vyvojar.Lenze to odporuje slovenskej povahe,urobit nieco pre druhych.Ja na to pouzivam apl. Antelli od ceskeho vyvojara,nieje to sice 100%,lebo je ta aplikacia v cestine,ale ked sa s tym pohras,tak to funguje perfektne,mozes hlasom ovladat funkcie vytacanie hovoru,spustanie vsetkych aplikaci,web.stranok,navigaciu…..

Pridaj komentár

+