Sadržaj:
- 1. Ne zaboravite logistiku
- 2. Promatrajte svoje podatke
- 3. Algoritmi nisu čarobni metci
- 4. Koristite raznolik skup alata
- 5. Eksperimentirajte s hibridnim učenjem
- 6. Jeftino ne znači loše
- 7. Ne zovi to AI
Video: Principi Uspjeha - Jack Canfield - Kako Biti Uspješan (64 Načela) (Prosinac 2024)
Prvi dio našeg poslovnog vodiča za strojno učenje (ML) otkrio je kako je krovni koncept ML-a mnogo više nijansiran u poslovnom okruženju. Najefikasnije strategije gledaju na ML u praktičnom smislu, koristeći složene tehnike dubokog učenja i manje intenzivne tehnike „jeftinog učenja“ za optimizaciju poslovnih procesa i stjecanje opipljivih uvida u poslovnu inteligenciju (BI).
Cilj primjene ML-a u vašim poslovnim aplikacijama je poboljšati konačnu vrijednost ili pritisnuti konkurentsku prednost vaše tvrtke. Ali u većoj shemi vaše organizacije, što više vremena i resursa ulažete u ovaj proces daleko je više od algoritama. Donositelji odluka u vašem poslovanju trebaju osigurati da sve što uđe u vaš razvoj ML-a - od podataka i logistike do načina na koji komunicirate s korisnicima - djeluje kohezivno zajedno kako bi povećali učinkovitost.
Ted Dunning, dr. Sc., Glavni je arhitekt aplikacije MapR, poslovnog softverskog poduzeća koje nudi razne distribucije velikih podataka i alate za upravljanje podacima. Dunning je također bio autor dvije knjige o onome što naziva „Praktično strojno učenje“ te je tijekom godina razvio ML tehnologije za brojne tvrtke, uključujući sustav otkrivanja prijevara ID Analytics (kupio ga LifeLock) i softver Musicmatch Jukebox, koja je kasnije postala Yahoo Music. Trenutno također obavlja potpredsjednicu inkubacije za softversku fondaciju Apache.
Dunning je gledao kako se ML prostor razvija desetljećima i naučio je puno o tome što djeluje, a što ne može u praktičnom poslovnom okruženju. U nastavku, Dunning izlaže sedam najboljih praksi koje treba slijediti kod razvoja poslovnih rješenja ukorijenjenih u ML-u.
1. Ne zaboravite logistiku
Uspješna ML ne odnosi se samo na odabir pravog alata ili algoritma. Dunning je rekao da također morate shvatiti koji pristup je prikladan i dizajnirati ga za određenu situaciju u kojoj se bavite. Na primjer, Dunning je govorio o ML-u u marketinškoj kampanji za razliku od daleko složenijih scenarija poput algoritama koji vode jedan autonomni automobil. Potrošnja resursa za inkrementalno poboljšanje algoritma vrijedno je problema s automobilom, ali u marketinškom scenariju vidjet ćete daleko bolji povratak od optimizacije cjelokupne logistike oko njega.
"Često, za tvrtke, logistika, a ne učenje, daje vam vrijednost. To je dio na koji biste trebali trošiti svoje vrijeme i resurse", rekao je Dunning. "Prilagođavanje algoritma donijelo bi vam malo poboljšanja. Ali prilagođavanje tih podataka, GUI-ja i načina na koji slušate i interakciju sa svojim korisnicima lako bi vam moglo donijeti 100-postotno poboljšanje. Trošenje vremena podešavanja algoritma vrijedi djelić kao mnogo za tvrtke koliko slušaju vaše korisnike."
Da bi ilustrirao ovo stajalište, Dunning je objasnio kako je svojedobno izgradio model za prepoznavanje prijevara u aplikacijama (otvaranje lažnih računa s ukradenim identitetima) u bazi podataka klijenata. Model koji je izradio dao je sjajne rezultate, ali Dunning je primijetio kako je on jako vagao spol podnositelja zahtjeva.
Pokazalo se da je logistika isključena. Način na koji je funkcionirao postupak prijave, podnositelj zahtjeva ispunio je spol tek nakon što je već postao klijent i prošao nekoliko koraka za provjeru kako bi filtrirao prevarante. Dakle, koristeći rodno polje, ML model je varao logistiku cijelog postupka prijevara. To nema nikakve veze s algoritmom i sve što je s tim kako je tvrtka dobivala svoje podatke.
2. Promatrajte svoje podatke
Dunning je pun privlačnih sitnica mudrosti. Nakon što je započeo s "to je logistika, a ne učenje", rekao je da je druga polovica te ideje "to su podaci, a ne algoritmi". Veliki dio osiguravanja ML algoritama koji pružaju vrijedne uvide osigurava da ih hranite ispravnim podacima. Dunning je rekao, ako ne dobijete rezultat zbog kojeg tražite, češće nego ne zato što ne koristite prave podatke.
"Ljudi su navikli na ego i vezani su za određene algoritme, ali danas, zbog alata koji su vani, svi i njihova majka mogu i smisle sve vrste novih algoritama", rekao je Dunning. "Podaci su mnogo važniji i dati će vam puno više dizanja od beskrajne promene algoritama. Ako radite na teškim problemima poput prepoznavanja govora ili računalnog vida, to je jedno. Ali ovo je polje zasnovano na podacima. U većini scenarija koristit ćete daleko više od prilagođavanja podataka koje dobivate i mijenjanja pitanja."
To je Dunning učinio sredinom 2000-ih, kada je u kompaniji pod nazivom Veoh Networks izgradio motor s video preporukama. Tim je radio na identificiranju parova videozapisa generiranih od korisnika na koje su ljudi kliknuli više nego što se očekivalo, ali algoritam nije radio. Razmišljali su o glazbi, gdje korisnici poznaju svoje omiljene izvođače i pjesme po imenu. Stoga su promijenili pitanje ugađanjem korisničkog sučelja bez dodirivanja samog algoritma.
"U videozapisima generiranim od strane korisnika, nitko ne zna da su izvođači i mnogi videozapisi zaista imali neželjene naslove da bi dobili više pregleda. Vožnja biciklima po izradi algoritma nikada nam ne bi dala dobre rezultate", rekao je Dunning. "Ono što smo učinili promijenilo je korisničko sučelje kako bi se svakih 10 sekundi odašiljao signal svjetionika. Otkrili smo da ako za neobrađene podatke preporuke upotrijebimo beacon umjesto klikova, dobijemo izvanredne rezultate. Otkriće ove promjene bilo je nekoliko stopostotno poboljšanje angažmana zbog preporuka, bez algoritamskih promjena."
3. Algoritmi nisu čarobni metci
Implementacije ML-a uspijevaju u neprekidnom pokušaju i pogreškama. Bez obzira na to koliko su dobri vaši algoritmi, ako vaš sustav komunicira s ljudima, tada će se on morati prilagoditi. Dunning je naglasio da bi tvrtke trebalo neprestano mjeriti ukupnu učinkovitost njihove primjene te identificirati promjene i varijable koje je čine boljom i pogoršavaju. To možda zvuči kao ravnodušnost, ali Dunning je rekao da, unatoč tome koliko očito zvuči, vrlo malo ljudi radi ovo ili čini dobro.
"Mnogo ljudi želi implementirati sustav ili poduzeti neke radnje, a oni žele da im algoritam zauvijek savršeno radi", rekao je Dunning. "Nijedan algoritam neće biti čarobni metak. Nijedan dizajn korisničkog sučelja neće se zauvijek držati. Nijedna metoda prikupljanja podataka nikada se neće zamijeniti. Sve se to može i dogoditi, a tvrtke moraju budno pratiti, procjenjivati i precjenjivati kako njihove sustav funkcionira."
4. Koristite raznolik skup alata
Na raspolaganju su deseci ML alata, od kojih mnoge možete koristiti besplatno. Imate popularne knjižnice okvira otvorenog koda kao što su Caffe, H20, Shogun, TensorFlow i Torch, te ML knjižnice u brojnim projektima Apache Software Foundation (ASF), uključujući Mahout, Singa i Spark. Zatim postoje mogućnosti pretplate temeljene na pretplati, uključujući Amazonsko strojno učenje, BigML i Microsoft Azure Machine Learning Studio. Microsoft ima i besplatni kognitivni alat.
Na raspolaganju su bezbrojni resursi. Dunning je razgovarao s brojnim poduzećima, istraživačima podataka i ML-ima i uvijek ih pita koliko različitih okvira i alata koriste. Dunning je u prosjeku rekao da većina koristi najmanje 5-7 alata, a često i mnogo više.
"Ne možete se zalijepiti za jedan alat. Morat ćete ih koristiti nekoliko, a kao takav, bolje je izgraditi svoj sustav na način da bude agnostičan", rekao je Dunning. "Svi koji vas pokušaju uvjeriti da je ovaj alat jedini koji će vam ikada trebati prodaje vam robu.
"Nešto bi se moglo dogoditi sljedeći tjedan što bi uznemirilo kolica s jabukama, a stopa inovacije koju primjećujemo, to će se održavati barem još pet do 10 godina", nastavio je Dunning. "Pogledajte primjer jeftinog učenja gdje možda ponovo upotrebljavate postojeći klasifikator slika za analizu slika u katalogu. To je duboko učenje s ubačenim računalnim vidom. Ali postoje vani alati koji su sve to spakirali. Trebate kako biste izmjerili, procijenili i varirali između različitih alata, a vaša infrastruktura to mora pozdraviti."
5. Eksperimentirajte s hibridnim učenjem
Dunning je rekao da i jeftino i duboko učenje možete kombinirati u nešto hibridno. Na primjer, ako uzmete postojeći model računalnog vida i rekonstruirate prvih nekoliko slojeva gdje se donosi odluka, tada možete kooptirati postojeći okvir za potpuno novi slučaj uporabe. Dunning je ukazao na Kaggle natjecanje u kojem su natjecatelji učinili upravo to; uzeli su skup podataka i napisali novi algoritam na vrhu kako bi pomogli računalu da razlikuje mačke od pasa.
"Razlikovanje mačaka i pasa vrlo je suptilna stvar za ML algoritam. Razmislite o logici: Mačke imaju šiljaste uši, ali isto tako imaju i njemački ovčari. Psi nemaju mrlje, osim Dalmatinaca itd. To može biti prilično teško prepoznati samo po sebi ", rekao je Dunning. "Tip koji je pobijedio razvio je sustav koji je to učinio s 99 posto točnosti. Ali više me se dojmila osoba koja je ušla na treće mjesto. Umjesto da se ispostavi, uzeo je postojeći program za prepoznavanje slike iz drugog zadatka, skinuo je gornji sloj i tamo stavio jednostavan klasifikator. Naveo je neke primjere, a uskoro je bilo 98 posto točno u razlikovanju mačaka od pasa. Cijeli postupak je momku trajao tri sata."
6. Jeftino ne znači loše
Unatoč otvorenoj konotaciji, Dunning je rekao da jeftino učenje ne znači loše učenje. Količina vremena koje potrošite na implementaciju ML-a izravno ne odgovara njegovoj poslovnoj vrijednosti. Važnija kvaliteta, rekao je, jest osigurati ponovljiv i pouzdan postupak. Ako je posao u stanju to postići bez ulaganja nepotrebne količine resursa, onda je to još bolje.
"Jeftino ne znači loše. Ako djeluje, funkcionira. Ako je jeftino i radi, to je sjajno. Ali trud koji uložite u izgradnju ne definira vrijednost. To je pogrešna vrijednost", rekao je Dunning, "Ono što definira vrijednost je kako poboljšava poslovanje. Ako povećava profit ili smanji troškove ili poboljšava vašu konkurentnu situaciju. To je učinak, a ne trud."
7. Ne zovi to AI
Dunning je naglasio da, kada govorimo o tim tehnikama, tvrtke trebaju koristiti preciznu terminologiju: ML, računalni vid ili duboko učenje. Sve to ima tendenciju pod krovnim izrazom "umjetna inteligencija", ali, prema Dunningu, definicija AI-ja jednostavno je "stvari koje još ne djeluju."
"Najbolja definicija koju sam čuo za AI je da stvari još ne možemo objasniti. Stvari koje još nismo shvatili", rekao je Dunning. "Svaki put kada se nešto pokrene, ljudi kažu:" Oh, to nije AI, to je samo softver. To je samo motor pravila. To je zapravo samo regresija logistike. " Prije nego što nešto smislimo, nazivamo ga AI. Nakon toga uvijek ga nazivamo nečim drugim. Na mnogo načina AI je bolje upotrijebiti kao riječ za sljedeću granicu, a u AI će uvijek postojati sljedeća granica. AI je kamo idemo, a ne tamo gdje smo već stigli."