Video: Сказки на ночь от Сири | Siri iPhone (Studeni 2024)
Inteligentni pomoćnici - Siri, Google Now, Cortana i slično - prešli su od radoznalosti i salona samo prije nekoliko godina do bitnih alata koje mnogi koriste u svakodnevnom životu. Prošli tjedan odustao sam od konferencije Inteligentnih asistenata u New Yorku, koju je predstavilo Opus Research, i bio sam impresioniran napretkom koji softver postiže u raznim industrijama, uključujući napredak financijskih, osiguravajućih i medicinskih kompanija u izgradnji specifičnih agenata,
Osnivač Opus istraživanja Dan Miller objasnio je da mnoge osnovne tehnologije, poput prepoznavanja govora, postoje već više od 20 godina. Iako je u posljednje vrijeme uočio neka velika poboljšanja, a ne revoluciju, rekao je da smo "na evolucijskom putu", s puno proizvoda na kontinuumu s različitim mogućnostima. Primijetio je da postoje stotine inteligentnih pomoćnika poduzeća koji se mogu koristiti za jednostavan tekstualni razgovor na običnom engleskom jeziku pomoću fiksnog skupa podataka i za stvari poput navigacije po web mjestu ili FAQ-a. Na drugom kraju spektra, vjerojatno postoji samo nekoliko desetaka "dinamičnih, ljudskih osjećaja" aplikacija koje su razgovornije i više svjesne konteksta.
Miller je ukazao na prijave koje su na konferenciji osvojile nagrade. Amtrakova Julie započela je kao interaktivni agent za govorne pozive prije mnogo godina, ali sada se razvila u agent koji radi na web mjestu kako bi putnike preko Amtrak.com vodio, temeljeno na agentu tvrtke Next IT. Telefonica Mexico ima agenta po imenu Nico koji ima avatar i koji pruža podršku putem Twittera i Facebooka, a temelji se na platformi AgentBota. ING Nizozemska ima Inge, aplikaciju koja omogućuje provjeru stanja na vašem bankovnom računu ili prijenos novca putem glasa, koristeći biometrijsku tehnologiju glasa Nuance, radi provjere identiteta.
Počasni spomenici uključuju zdravstvene programe, poput aplikacije koja vam pomaže odabrati zdravstvenu shemu. Ostale aplikacije za koje sam čuo na izložbi uključuju Domino's Pizza koji ima aplikaciju pod nazivom Dom koja vam omogućuje da koristite glas za naručivanje pizze; i BMW, koji ima virtualnog agenta kao dio ruke za financiranje automatskog financiranja Up2drive.
Nuanceov Brett Beraneck govorio je o tome kako je napredak neuronskih mreža za duboko učenje poboljšao stvari poput razumijevanja prirodnog jezika kao i prepoznavanja glasa i kako se to sada zbližava kako bi se omogućilo puno više interesa na terenu. Nuanceova Nina pomoćnica bila je rani primjer i od tada je narasla na mnoštvo specifičnih aplikacija, u rasponu od interaktivnih sustava govornog odgovora u osiguravajućim društvima, do aplikacija za kupovinu. Svaka od ovih aplikacija ima različitu osobnost, ovisno o tome što vam pokušava pomoći.
Jedna velika novost o kojoj je razgovarao bila je biometrija glasa, u kojoj vaš glas zamjenjuje lozinku. Govorio je o tome kako tvrtke poput ING-a u Europi razvijaju agente koji ne samo da koriste prepoznavanje glasa i prirodnu obradu jezika, već i počinju koristiti glas kako bi prepoznali osobu koja zove. Rekao je da je to i sigurnije i prirodnije od tradicionalne lozinke.
Iako su se nedavne studije zabrinule kako bi snimanje glasa moglo zavarati takve sustave, Nuance je primijetio da današnja tehnologija uključuje značajke usmjerene na prikupljanje anomalija iz snimljenog glasa i ukazao je na druga istraživanja koja su zauzela drugačije stajalište. Osim toga, dizajneri mogu upotrijebiti različite razine biometrike glasa za različite funkcije, poput jednostavnog prepoznavanja za provjeru stanja na računu ili traženja da ponovite slučajni niz riječi za značajne novčane transfere.
Čini se da glasovna biometrija nešto privlači. Prošlog tjedna na Gartner-ovom simpoziju, sjednica o "cool slučajevima klijenata" u financijskim uslugama uključivala je i aplikaciju Citibank koja je koristila ovu značajku.
MyWave ima pomoćnika zvanog Frank koji bi trebao omogućiti više tvrtki kako bi vam omogućio interakciju s njima na razgovorljiviji način, a ne da svaka tvrtka razvija svoje. Prve upotrebe uključuju novozelandsku banku i aplikaciju pod nazivom Saveawatt koja je osmišljena kako bi vam pomogla u odabiru vašeg dobavljača električne energije.
Izvršni direktor Geraldine McBride objasnio je da tvrtka pokušava stvoriti pomoćnike koji premošćuju jaz između kupaca i servisnih aplikacija, s onim što naziva "odnosima s klijentima koji upravljaju" ili CMR, što je spin na tradicionalnim CRM aplikacijama. Velika je razlika, rekla je, da je kupac zadužen za sve svoje podatke, a ne posao.
Još jedna relativno nova tvrtka, Expect Labs, nudi proizvod nazvan MindMeld koji djeluje kao podloga za brojne tvrtke koje žele ponuditi glasovno sučelje za zamjenu tradicionalnih sučelja i rješavanje pitanja i odgovora. To bi se moglo koristiti za razne aplikacije, kao što je gledanje TV emisija samo postavljanjem imena i sustavom zatražiti više sustava. (Amazonova vatrogasna televizija ima neke od ovih značajki, ali nije integrirana u vaš kablovski prijemnik, dok je jedan od ulagača u Expect Labs kablovska kompanija Liberty Global.)
Izvršni direktor Tim Tuttle objasnio je da MindMeld nastoji prepoznati govor koji je već dostupan na većini uređaja, a umjesto toga se fokusira na razumijevanju prirodnog jezika i izgradnji grafikona znanja od dostupnih informacija. Rekao je da firma pokušava razmjestiti sustav tako da uključuje više informacija iz više izvora i razbiti hijerarhije različitih kategorija informacija koje su dio većine takvih sustava. Stvarno razumijevanje pitanja znači biti u stanju razumjeti namjere u raznim kategorijama, rekao je.
Jedna stvar koju sam čuo od brojnih sudionika bila je statistika koja sugerira da se oko 10 posto svih pretraživanja na webu sada vrši putem obavještajnih agenata. (Pionir AI Andrew Ng rekao je da je to istina za glasovnu pretragu na Baidu prošle godine. Nekoliko ljudi je reklo da je to sada istina i kod Googlea, ali nisam čuo potvrdu iz prve ruke.)
Gledajući prema naprijed, Miller tvrtke Opus Research rekao je da treba još puno posla. Osnovna točnost sustava ima puno prostora za poboljšanja, posebno u prelasku s onoga što kažete na ono što mislite i onoga što treba učiniti. Spomenuo je razgovor na sastanku s izvršnim direktorom Xerox PARC-a Stephenom Hoverom, koji je rekao da su sustavi danas i do 90 posto točni u razumijevanju onoga što mislimo, ali da je 10 posto i dalje problem jer je to ono čega se većina sjeća kada se bavi sustav. A Miller je rekao da postoji prostor za bolju personalizaciju, jer ako sustav zna s kim razgovara, može dati bolje rezultate. Na primjer, primijetio je da Facebook zna tko koristi sustav jer ste prijavljeni; i rekao da će to neprimetno postupanje s više agenata postati važnije.
To je sigurno fascinantna kategorija, a očekujem da ćemo svi trošiti puno više vremena razgovarajući s našim telefonima i računalima i komunicirajući s agentima koji nisu baš ljudski. Ovo je jedan od najintrigantnijih trendova u računanju ovih dana.