Programovanie

Klávesnica? Aké kuriózne

Éra hlasového vyhľadávania a hlasom ovládaného softvéru je pred nami. Ako vývojár žijem a zomieram pri klávesnici, ale už vidím znaky: Ako napríklad veľa ľudí, hovorím so svojím telefónom s Androidom (napríklad „Navigate to Lowes [or Starbucks or Harris Teeter]“), získať smer.

V správe Internetových trendov Mary Meekerovej z roku 2016 uvádza, že vyhľadávacie dopyty Google Voice sa od roku 2010 zvýšili sedemkrát. Všimol som si tiež, že môj 12-ročný syn takmer všetky svoje vyhľadávania vyhľadáva pomocou hlasu - a moje priateľka mi takto píše pravidelne. Spoločnosť, pre ktorú pracujem, spoločnosť Lucidworks, nedávno oznámila nové partnerstvo s IBM s cieľom integrovať Watson a možnosti prevodu textu na reč do nášho produktu podnikového vyhľadávania.

Táto technológia funguje oveľa lepšie ako predtým a je ľahšie ju integrovať do aplikácií. Ak vyvíjate pre Android alebo iOS, môžete sa ľahko zapojiť do rozhraní API na rozpoznávanie reči. Rozpoznávanie reči však nezačína a nekončí jednoduchými príkazmi na prevod reči na text a hlasom.

Pochopenie zámeru vyhľadávania je veľmi kontextová úloha, najmä v hovorenom jazyku. Ľudia majú navyše tendenciu používať viac slov v prirodzenom hovorenom jazyku, ako keď sú konfrontovaní s vyhľadávacím panelom. V hovorenom jazyku je viac „šumových slov“ ako v bežnom textovom vyhľadávaní.

Toto sú významné výzvy týkajúce sa umelej inteligencie. Ale keď prekonáme kontextový problém, vývojári sa naučia, že s hlasom sa dá urobiť viac ako s textom. Svoju úlohu bude hrať emocionálny kontext. Ak hľadáte benzínovú pumpu, chcete najlacnejšiu alebo najbližšiu? Emocionálny obsah vášho hlasu by to mohol naznačovať. Iste, možno objasníte, ale možno nebudete musieť.

Vaša zhovorčivá budúcnosť

Hlasová epocha nie je o samotnom hľadaní. Ovplyvní to celú našu interakciu s počítačmi. V nie príliš vzdialenej budúcnosti budú klávesnice považované za „kuriózne“, ako ich Scotty slávne opísal v „Star Treku IV“.

Táto zmena si však vyžaduje aj úplne nové používateľské rozhranie. Tu je starodávna ilustrácia toho, čo mám na mysli: Keď vyšiel Windows 95, IBM integrovala do svojich počítačov hlasové príkazy. V tom čase som pracoval ako predajca v kancelárii Office Depot a rýchlo sa ukázalo, aké nepraktické sú hlasové povely. Okenné rozhranie sa k tejto forme interakcie vôbec nehodilo.

Myslím tým, ako do pekla presuniete okno z cesty inému oknu a zmeníte jeho veľkosť tak, aby sa účinne zmestili na obrazovku pomocou hlasových príkazov? Ty nie. Tieto okná (a pravdepodobne aj Windows) úplne vypustíte. Hlasové rozhranie nepoužíva rovnaké motívy. Na „Star Treku“ nikdy nevidíte rozhranie s oknami.

Keď už hovoríme o „Star Treku“, keď ľudia začnú programovať alebo robia niečo technické, vždy prejdú na hmatové rozhranie (OK, nie úplne hmatové - vyzerá to skôr ako mikrovlnná klávesnica prekrytá secesnými vykresleniami dosky s plošnými spojmi). Je však nutná regresia k „písaniu na stroji“? Je pravda, že si neviem predstaviť, že by som na kódovanie v Scale použil hlasové rozhranie. Možno budú vyvinuté nové jazyky (bez zátvoriek, na rozdiel od Scaly - a mojich článkov), ktoré sú špeciálne vhodné pre hlas.

Webové stránky určite nebudú vyzerať rovnako a ponúknu nové navigačné vzory. Poviete „ukážte mi ponuky topánok“ a to, čo dostanete späť, bude pravdepodobne lepšie organizované a kontextovo citlivejšie ako váš priemerný web („ponuky“ a „topánky“). Navyše nebudem chcieť veľa posúvať alebo hovoriť „ďalšia stránka“, takže interakcie budú musieť byť personalizované. Systém by už mal vedieť, že chcem pánske topánky a nechcem topánky na tvrdom podpätku kvôli mojej achilovke. Možno vie, že mám radšej tmavé farby. Možno som to povedal alebo možno to analyzovalo moje správanie.

Je to vôbec web? Iste, ak nakupujem topánky, budem chcieť vizuálne znázornenie, ale ak hovorím, možno stroj hovorí naspäť. Možno mi to ukazuje topánky, potom sa pýta: „Hľadáte konkrétny typ obuvi? Na čo sú tieto topánky určené? Máte ich na turistike alebo na párty?“

Éra hlasového vyhľadávania zmení všetko od interakcie so strojmi po kódovanie. Mnoho technológií, ktoré potrebujeme, nám je už dnes k dispozícii, zatiaľ čo iné ešte len budú vynájdené. Účinok na používateľské rozhranie by mohol byť výraznejší ako prechod z diernych štítkov na klávesnice.

Táto rozsiahla zmena nepríde naraz. Dnes nie je ten deň, kedy by ste mali vyhodiť klávesnicu. Môže to však byť deň, kedy začnete premýšľať o prepracovaní vášho webu tak, aby bol skutočne prístupný hlasu.

$config[zx-auto] not found$config[zx-overlay] not found