Video: Yuji Nishida Destroys Canada with 6 Aces in a Row | World Cup 2019 (Prosinac 2024)
Jedna stvar koja me se dojmila na jučerašnjem Samitu o tehnologiji poduzeća Bloomberg je fokusiranje na bavljenje podacima na nove načine - drugim riječima, bavljenje onim što se često naziva "velikim podacima".
Neki od razgovora bavili su se vrijednošću velikih podataka i je li to zaista bila „prilika od trilijuna dolara“, dok su se drugi bavili specifičnim izazovima s kojima se pojedine organizacije i industrija u cjelini suočava u širem raspoređivanju ovih novih tehnika.
Gerard Francis, globalni šef Bloomberg Enterprise Solutions, Bloomberg LP započeo je dan sugerirajući da je najvažnije što kompanije mogu učiniti "iskoristiti vrijednost podataka koristeći ih" te se fokusirati na pristup, kvalitetu i protok podataka podaci unutar organizacije. Na slijedećim panelima puno se govorilo o novim alatima koji se bave podacima, kao i specifičnim pitanjima pohranjivanja, upravljanja i pronalaženja ljudi koji se bave podacima.
U općem panelu o trendovima poduzeća, Dwight Merriman, predsjednik i suosnivač MongoDB-a, rekao je da podatkovni sloj programske staze ima "najveći poremećaj i promjene koje smo vidjeli u 25 godina". Rekao je da tvrtke koriste relacijske baze podataka već 25 godina ili više, čineći to najstarijom tehnologijom u hrpi. Ali sada se događaju pohrane sa datotekama, kao što su Hadoop i nove tehnologije baza podataka, često grupirane kao "NoSQL". Napomenuo je da se Big Data ne radi o "velikim", već o obliku podataka, vrstama podataka i kretanju prema obradi podataka u stvarnom vremenu.
Googleov glavni direktor za informacije Benjamin Fried složio se da većina poduzeća nema problema s "velikim podacima". Mnogi od skupova podataka - s stvarima poput HR podataka i financijskih podataka - nisu tako veliki, rekao je. Ono što je važno je fleksibilnost koja vam je potrebna za pravilno rukovanje podacima.
Što su uopće veliki podaci?
Taj je koncept - ta fleksibilnost važna koliko i veličina podataka - odjeknuo na drugom panelu kasnije tijekom dana. Tamo su se sudionici složili da se tvrtke već dulje vrijeme bave aplikacijama koje teže podataka, ali se u posljednje vrijeme mjerilo promijenilo. Na primjer, Mark F. Bregman, stariji potpredsjednik i glavni direktor tvrtke Neustar, primijetio je da neke tvrtke sada "spremaju sve" u nadi da će se pokazati vrijednim.
"Veliki je bolje definirati kao složenost", prema Gary Bloomu, izvršnom direktoru i predsjedniku MarkLogića. Napomenuo je da mnoge takozvane aplikacije "velikih podataka" uključuju mnoštvo različitih vrsta podataka, ali ne i vrstu glasnoće koju obično čujete u "velikim podacima" aplikacijama.
Naveo je primjer zračnog prometa koji kombinira vremenske podatke, podatke o aerodromima, geoprostorne podatke, podatke o letovima, podatke o rezervaciji zrakoplovne tvrtke i društvene podatke. Napomenuo je da je bavljenje heterogenim podacima zaista teško napraviti s tradicionalnim relacijskim bazama podataka, ponavljajući ranije komentare MongoDB-ovog Merrimana da je ovo "prvi generacijski pomak u bazi podataka u 25 godina" otkako smo prešli iz mainframe-a u eru relacijskih baza podataka.
Napomenuo je da mnogi ljudi govore o podacima na društvenim mrežama, ali to je zaista potrebno kombinirati s drugim podacima kako biste zaista imali nešto na čemu možete iskoristiti. Kombiniranje ovih podataka "je prava vrijednost".
Dakako, neke aplikacije sadrže puno informacija, a Bregman kaže da je heterogenost samo jedan od čimbenika. Naveo je DNS podatke, koji lako mogu generirati 8TB podataka dnevno, i potrebu za pohranjivanjem takvih stvari u Hadoop. Bregman i ostali primijetili su da kada je riječ o "kapitalizaciji podataka", stvarna vrijednost nije u sirovim podacima, već umjesto toga u analitičnosti kad postane nešto što možete koristiti. Ostali na ploči složili su se.
Izvršni direktor Streambase-a Mark Palmer rekao je da je kombiniranje velike količine podataka s analitikom za strujanje važno u mnogim aplikacijama; i razgovarali o dodatnoj vrijednosti koja bi se mogla stvoriti kombiniranjem tradicionalne analitike i u stvarnom vremenu.
Ali složio se da je složenost podataka problem. Naveo je kako je Vivek Ranadivé, koji vodi Tibco (koji sada posjeduje Streambase), dijelom kupio košarkaški tim kako bi otkrio kako tehnologija može poboljšati iskustvo navijača. Opet je govorio o "prikupljanju različitih vrsta podataka", počevši od Twittera, ali i iskorištavanju drugih vrsta podataka.
Bloom je napomenuo da sve ovisi o aplikaciji, rekavši da je "kašnjenje pred očima promatrača". Neke aplikacije trebaju raščlaniti podatke na žici prije nego što uopće naiđu na bazu podataka, dok druge ne.
Bregman je pokrenuo pitanje da umjesto da teško premješta računske resurse, sada je mnogo teže premjestiti podatke. Napomenuo je da je za mnoge aplikacije "zaključavanje" mjesto podataka. Jednom kada pohranite svoje podatke u javni oblak, teško ih je premjestiti. Kao rezultat toga, rekao je, mnoge organizacije žele pohraniti ogromne količine podataka na svoje lokacije, a zatim biti u mogućnosti premjestiti se na različite davatelje usluga za računanje funkcionalnosti. Posuđujući termin iz MarkLogićevog Blooma, govorio je o tome kako je organizacijama možda potreban "centar podataka u središtu podataka" kao mjesto na kojem čuvate ogromne količine podataka.
Jesu li veliki podaci "prilika od trilijuna dolara?"
Porter Bibb iz MediaTech Capital Partnera, Cloudera's Doug Cutting, Snaplogickov Gaurav Dhillon i Bloomberg Link-a Jason KellyDrugi je panel raspravljao o prilikama i izazovima koje donose veliki podaci, osvrćući se na komentar Portera Bibba, upravljačkog partnera MediaTech Capital Partnersa. Bibb je rekla da korporacije koriste nove tehnike koristi više od trilijuna dolara koristi. Do danas, rekao je, mi "još nismo počeli iskorištavati potencijal koji ova tehnologija nudi."
Bibb je govorila o tome kako je važno za organizacije da usklade svoju strategiju podataka s poslovnom strategijom, a zabrinuta je što većina korporativnih i vladinih sustava nisu usklađeni.
U toj prvoj sesiji Scott Weiss iz Andreessena Horowitza rekao je da je "Hadoop poput kriogene skladištenja", pa je moderator Jason Kelly iz Bloomberga Link pitao glavnog arhitekta Cloudere Douga Cuttinga, koji je u prvom redu jedan od tvorca Hadoopa, kako on gleda da.
Rezanje rečenog da Hadoop omogućuje ljudima da rade s više podataka. Rekao je da organizacije povlače podatke s vrpce, a umjesto toga čine ih internetskim i upotrebljivim. Korisnici prelaze s rada s 90 dana podataka na pet ili 10 godina podataka u "aktivnoj arhivi".
Na ovom se panelu ponovo pojavila brojna specifična pitanja bavljenja svim tim podacima. Izvršni direktor Snaplogic-a Gaurav Dhillon govorio je o "gravitaciji podataka", rekavši da nema smisla uzimati podatke koji se nalaze na lokalnoj lokaciji u Hadoopu i premještati ih u oblak. Ali istovremeno, ako postoje podaci u oblaku, kao što je analiza klikovnog toka, nema smisla premještati to na lokalno područje. Zbog toga je, rekao je, vidio vrlo malo "prekograničnih mogućnosti" u kretanju podataka.
Cutting je rekao da ne vjeruje da zaista postoji nedostatak znanstvenika s podacima. Umjesto toga, rekao je da ima puno ljudi koji razumiju matematiku i posao, ali jednostavno nemaju alate. Možete naučiti osnove alata i ono što oni rade za nekoliko tjedana, rekao je, ali za razumijevanje vašeg poslovanja trebate godine. Ipak, postoji puno ljudi koji to razumiju.
Dhillon je također razmislio o zabrinutosti oko zakonodavstva koje se odnosi na informacije koje se mogu pohraniti. Rekao je da neka vertikalna tržišta zahtijevaju pohranjivanje informacija na lokalnoj razini, ali zabrinut je zbog stvari poput zahtjeva da se podaci ne premještaju iz zemlje u kojoj potječu. Mnogo je toga pretjerano reagiranje na stvari poput Snowdenovih otkrića i kršenja podataka, rekao je, napominjući kako "žurba s zakonodavstvom nikada nije dobro."
Upitan da li se brine da kršenja Snowdena i Targeta kupaca plaše zbog podataka, Cutting je rekao da je zabrinut zbog tolikog broja ljudi. Mnogi se ljudi plaše tehnologije, rekao je, a to je bio neuspjeh da industrija omogući kupcima ugodnost, shvaćajući da se njihovi podaci ne koriste. "Ne morate biti jezivi", rekao je.
Na kraju je bilo puno rasprava o procjenama, a Bibb je sugerirao da je nedavno Intelovo ulaganje u Clouderu "velika stvar", budući da potvrđuje što tvrtka radi. Rekao je da se i druge velike kompanije poput Oracle, IBM, Microsoft i Amazon kreću oko prediktivnih analitičkih kompanija. "Zlatni nalet tek počinje."
Dhillon je rekao da procjene odražavaju ono što vodovodne tvrtke donose na tržište velikih podataka. Kazao je da je sretan kad takvi momci s "šiljičem i lopatama" dobivaju dobre procjene, ali rekao je da ima malo straha od toga da procjene postanu ispred tržišta.
Bibb je rekao kako misli da se veliki podaci mogu prekomjerno eksponirati u medijima, ali je nedovoljno izložen u "c-suitu" (što znači izvršni direktori, CFO-i i drugi najviši rukovoditelji.) Rekao je da ima "ogroman ekonomski potencijal koji tek treba otkriti „.