Bahay Ipasa ang Pag-iisip Mga katulong na intelihente: ano ang darating pagkatapos ng siri?

Mga katulong na intelihente: ano ang darating pagkatapos ng siri?

Video: The 2020 Voice Assistant Battle. (Nobyembre 2024)

Video: The 2020 Voice Assistant Battle. (Nobyembre 2024)
Anonim

Ang mga Matalinong Katulong - Siri, Google Now, Cortana at mga katulad nito - ay umalis sa mga pag-usisa at trick ng parlor ilang taon na lamang ang nakalilipas sa mga mahahalagang kasangkapan na ginagamit ng maraming tao sa kanilang pang-araw-araw na buhay. Noong nakaraang linggo, bumaba ako sa pamamagitan ng Intelligent Assistants Conference sa New York, na ipinakita ng Opus Research, at humanga sa pag-unlad ng software ay ginagawa sa iba't ibang mga industriya, kabilang ang pag-unlad ng pinansiyal, seguro, at mga medikal na kumpanya sa pagbuo ng mga tiyak na ahente .

Ipinaliwanag ng tagapagtatag ng Opus Research na si Dan Miller na marami sa mga pangunahing teknolohiya, tulad ng pagkilala sa pagsasalita, ay nasa loob ng higit sa 20 taon. Bagaman kamakailan lamang ay nakita niya ang ilang mga malaking pagpapabuti, sa halip na isang rebolusyon, sinabi niya na "nasa landas tayo ng ebolusyon, " na may maraming mga produkto sa isang pagpapatuloy na may iba't ibang mga kakayahan. Nabanggit niya na may daan-daang mga intelihente na katulong na maaaring magamit para sa isang simpleng pag-uusap na batay sa teksto sa payak na Ingles gamit ang isang nakapirming set ng data, at para sa mga bagay tulad ng pag-navigate sa isang website o isang FAQ. Sa kabilang dulo ng spectrum, marahil mayroon lamang ilang dosenang "pabago-bago, apps na may pakiramdam ng tao" na mas nakaka-usap at kamalayan sa konteksto.

Itinuro ni Miller ang mga aplikasyon na nanalo ng mga parangal sa kumperensya. Ang Amtrak's Julie ay nagsimula bilang isang interactive na voice-response phone service agent taon na ang nakalilipas, ngunit ngayon ay nagbago sa isang ahente na gumagana sa website upang gabayan ang mga manlalakbay sa pamamagitan ng Amtrak.com, batay sa isang ahente mula sa Susunod na IT. Ang Telefonica Mexico ay may isang ahente na nagngangalang Nico na mayroong avatar at nagbibigay din ng suporta sa pamamagitan ng Twitter at Facebook, batay sa platform ng AgentBot. Ang ING Netherlands ay may Inge, isang app na hinahayaan kang suriin ang balanse ng iyong account sa bangko o maglipat ng pera sa pamamagitan ng boses, gamit ang boses na biometric na teknolohiya mula sa Nuance, upang mapatunayan ang iyong pagkakakilanlan.

Kasama sa marangal na pagbanggit ang mga aplikasyon ng pangangalagang pangkalusugan, tulad ng isang app na makakatulong sa iyo na pumili ng isang plano sa pangangalagang pangkalusugan. Iba pang mga application na narinig ko sa palabas ay kasama ang Domino's Pizza, na mayroong isang app na tinatawag na Dom na nagbibigay-daan sa iyo na gumamit ng boses upang mag-order ng pizza; at BMW, na mayroong isang virtual na ahente bilang bahagi ng braso ng Up2drive auto financing nito.

Ang Nuance's Brett Beraneck ay napag-usapan tungkol sa kung paano ang mga pagsulong sa malalim na pag-aaral ng mga neural network ay nagpabuti ng mga bagay tulad ng natural na pag-unawa sa wika pati na rin ang pagkilala sa boses, at kung paano ito magkakasamang magkasama upang paganahin ang mas maraming interes sa larangan. Ang katulong ni Nuance's Nina ay isang maagang halimbawa, at mula noon ay lumaki ito sa maraming mga tukoy na aplikasyon, na nagmula sa mga interactive na sistema ng pagtugon sa boses sa mga kumpanya ng seguro hanggang sa mga shopping app. Ang bawat isa sa mga application na ito ay may ibang pagkatao, depende sa kung ano ang sinusubukan nitong tulungan ka.

Ang isang malaking bagong tampok na tinalakay niya ay ang boses biometrics, kung saan pinalitan ng iyong tinig ang isang password. Pinag-usapan niya ang tungkol sa kung paano ang mga kumpanya tulad ng ING sa Europa ay bumubuo ng mga ahente na hindi lamang gumagamit ng pagkilala sa boses at natural na pagproseso ng wika, ngunit nagsisimula ring gumamit ng boses upang makilala ang taong tumatawag. Sinabi niya na kapwa mas ligtas at mas natural kaysa sa isang tradisyunal na password.

Habang nag-aalala ang mga kamakailang pag-aaral na ang mga pag-record ng boses ay maaaring lokohin ang mga naturang sistema, sinabi ni Nuance na ang teknolohiya ngayon ay nagsasama ng mga tampok na naglalayong kunin ang mga anomalya mula sa naitala na boses at itinuro sa iba pang mga pag-aaral na kumuha ng ibang pananaw. Bukod dito, sinabi niya, ang mga taga-disenyo ay maaaring gumamit ng iba't ibang mga antas ng biometrics ng boses para sa iba't ibang mga pag-andar, tulad ng paggamit ng simpleng pagkilala upang suriin ang isang balanse sa account, o hiniling sa iyo na ulitin ang isang random na pagkakasunud-sunod ng mga salita para sa mga makabuluhang paglilipat ng pera.

Ang biometrics ng boses ay tiyak na tila nakakakuha ng kaunting traksyon. Sa Gartner Symposium noong nakaraang linggo, isang sesyon sa "mga kaso ng cool na customer" sa mga serbisyo sa pananalapi kasama ang isang Citibank app na ginamit ang tampok na ito.

Ang MyWave ay may katulong na tinawag na Frank na sinadya upang paganahin ng maraming mga negosyo upang pahintulutan kang makipag-ugnay sa kanila sa isang mas mapag-usap na paraan, sa halip na magkaroon ng sariling negosyo ang bawat isa. Kasama sa mga unang gamit ang isang bangko sa New Zealand at isang app na tinatawag na Saveawatt na idinisenyo upang matulungan kang pumili ng iyong tagapagkaloob ng kuryente.

Ipinaliwanag ng CEO Geraldine McBride na sinusubukan ng kumpanya na lumikha ng mga katulong na tulay ang agwat sa pagitan ng mga customer at mga serbisyo ng serbisyo, kasama ang tinatawag na "mga relasyon na pinamamahalaan ng customer" o CMR, isang pag-ikot sa tradisyonal na mga aplikasyon ng CRM. Isang malaking pagkakaiba, aniya, na ang customer ay namamahala sa lahat ng kanyang data, sa halip na sa negosyo.

Ang isa pang medyo bagong kumpanya, ang Expect Labs ay may isang produkto na tinatawag na MindMeld na gumagana bilang isang backend sa isang bilang ng mga kumpanya na nais mag-alok ng isang interface ng boses upang palitan ang mga tradisyunal na interface at hawakan ang mga katanungan at sagot. Maaari itong magamit para sa iba't ibang mga application, tulad ng panonood ng mga palabas sa TV sa pamamagitan ng pagtatanong lamang sa pangalan at pagkakaroon ng query ng system ng maraming mga system. (Ang Fire TV ng Amazon ay may ilan sa mga tampok na ito, ngunit hindi isinama sa iyong cable set-top box, habang ang isa sa mga namumuhunan sa Expect Labs ay ang kumpanya ng cable Liberty Global.)

Ipinaliwanag ng CEO Tim Tuttle na ang MindMeld ay may posibilidad na magamit ang pagkilala sa pagsasalita na magagamit na sa karamihan ng mga aparato at sa halip ay nakatuon sa pag-unawa sa natural na wika at pagbuo ng isang kaalaman ng graph ng magagamit na impormasyon. Sinabi niya na ang kumpanya ay nagsisikap na masukat ang system upang maisama ang maraming impormasyon mula sa maraming mga mapagkukunan, at upang sirain ang mga hierarchies ng iba't ibang mga kategorya ng impormasyon na isang bahagi ng karamihan sa mga nasabing mga system. Ang tunay na pag-unawa sa mga tanong ay nangangahulugang nakakaunawa ng hangarin sa iba't ibang mga kategorya, aniya.

Isang bagay na narinig ko mula sa isang bilang ng mga dumalo ay ang mga istatistika na nagmumungkahi na ang tungkol sa 10 porsiyento ng lahat ng mga paghahanap sa Web ay tapos na ngayon sa pamamagitan ng mga ahente ng intelihente. (Sinabi ng payunir ng AI na si Andrew Ng na ito ay totoo para sa paghahanap ng boses sa Baidu noong nakaraang taon at maraming mga tao ang nagsabi na ito ay totoo ngayon sa Google, ngunit wala akong narinig na anumang kumpirmasyon sa unang kamay.)

Inaasahan, sinabi ng Opus Research's Miller na mayroong maraming trabaho na dapat gawin. Ang pangunahing katumpakan ng mga system ay may maraming silid para sa pagpapabuti, lalo na sa paglipat mula sa sinasabi mo sa kung ano ang ibig mong sabihin bilang isang resulta. Nabanggit niya ang isang pahayag mula sa CEO ng Xerox PARC na si Stephen Hoover sa kumperensya, na sinabi na ang mga sistema ngayon ay hanggang sa 90 porsyento na tumpak sa pag-unawa sa kung ano ang ibig sabihin namin, ngunit ang 10 porsiyento ay pa rin ng isang problema dahil ito ang tinatandaan ng karamihan sa mga tao kapag nakitungo sa isang sistema. At sinabi ni Miller na mayroong silid para sa mas mahusay na pag-personalize, dahil kung alam ng system kung sino ang nakikipag-usap, maaari itong magbigay ng mas mahusay na mga resulta. Halimbawa, nabanggit niya na alam ng Facebook kung sino ang gumagamit ng system dahil naka-log in ka; at sinabi na walang putol na ginagawa ito sa mas maraming ahente ay magiging mas mahalaga.

Tiyak na ito ay isang kamangha-manghang kategorya, at inaasahan kong lahat tayo ay gagastos ng maraming oras sa pakikipag-usap sa aming mga telepono at computer, at pakikipag-ugnay sa mga ahente na hindi masyadong tao. Nalaman ko ito ang isa sa mga pinaka nakakaintriga na mga uso sa pag-compute sa mga araw na ito.

Mga katulong na intelihente: ano ang darating pagkatapos ng siri?