Video: Big Data - КЛЮЧ К ПРАВДЕ (Nobyembre 2024)
Ang bagong lumitaw na "malaking data" meme ay hindi pa natukoy sa anumang makabuluhan at tiyak na paraan. Ito ang pinaka amorphous bagong buzz-term na nakita ko sa loob ng isang dekada. Ito ay isa sa mga salitang "eye of the seeer" na ginamit upang buhayin ang isang seminar at sa kalaunan ay magbabad ang mga namumuhunan.
Magsimula tayo sa pamamagitan ng pagtatanong kung ano ang ibig sabihin ng malaking data? Maraming data? Higit pang mga data kaysa sa maaari mong hawakan? Malaking data? Wala sa control data? Kapaki-pakinabang na data para sa pagsusuri? Walang data na data? Sobra ang impormasyon?
Kung nabasa mo nang sapat ang tungkol sa malaking data, lahat ito ay nasa itaas at higit pa. Ang susi ay hindi ang data, ngunit ang hamon kung paano hawakan ang data at kung ano ang gagawin sa data mismo.
Sa madaling salita, paano natin magagawa ang malaking tumpok na data na ito, na pinamamahalaan natin upang makaipon, maging kapaki-pakinabang sa bago at kumikitang mga paraan? Ang mga pool data ay maaaring magmula sa kahit saan sa pamamagitan ng iba't ibang mga mekanismo ng computing tulad ng mga post sa Facebook, mga log ng NSA, mga listahan ng pag-mail, mga customer, atbp.
Gusto kong magtaltalan na ang karamihan sa mga mambabasa ng kolum na ito ay ang kanilang mga sarili repository ng malaking data. Bumili lang ako ng isang 3 Terabyte drive para sa backup. Marami akong data na i-back up! Malaking data!
Ang isang kapaki-pakinabang na tool na maaari kong isipin ay isang malaking tool sa pagsusuri ng data na magagamit ng pulisya upang makitang nagkasala ka sa ilang mga random na krimen sa pamamagitan ng pagdaan sa iyong mga file. O hindi bababa sa makahanap ng isang bagay na nakakahiya sa iyo. Malaking data!
Ang lahat ng ito ay bumalik sa isang puna na ginawa ng isang dating CEO ng American Express, na nagsabi sa isang tagapakinig na kung nais ng kumpanya (at nalalapat ito sa lahat ng mga kumpanya ng credit card) maaari nitong gamitin ang iyong personal na mga gawi sa pagbili at tendencies upang magkasama ang isang kumpletong dossier at siguradong sabihin kung nagkakaroon ka ba ng isang karelasyon o hindi. Malaking data!
Mula sa kung ano ang masasabi ko, ito mismo ang ginagawa ng malaking data, sumubaybay sa mga indibidwal.
Ang tanyag na komentaryo ng industriya ay sa paanuman malaking mga database na naglalaman ng impormasyon tungkol sa iyo ay gagamitin para sa iyong benepisyo. Oo, alam mo, kaya makakakuha ka ng mga para sa mga bagay na talagang interesado ka. Naka-target na advertising. Nakikinabang ito sa lahat!
Narito kung paano ito gumagana. Interesado akong bumili ng isang bagong camera at maririnig ang tungkol sa bagong Bogus One. Nagbasa ako ng isang artikulo sa PCMag.com tungkol sa camera, pagkatapos ay pumunta ako sa Amazon at suriin ang mga presyo at mga pagsusuri ng gumagamit. Lumilitaw na parang walang nagustuhan sa camera. Ito ay isang malinaw na piraso ng crap. Lahat ng mga nagrerepaso ay nag-iwas sa camera. Kinamumuhian ng mga mamimili ang camera. Hindi ito isang camera na gusto ko. Ngunit ang malaking software sa pagtatasa ng data ay nagpasiya na bigyan ako ng daan-daang mga ad, sa bawat webpage na binibisita ko, lahat ay nagpapakita ng kamera ng Bogus One. Malaking data!
Ito ay mas masahol kaysa sa. Kung ang mga bagay ay napunta sa kabilang direksyon at nagpasya akong nagustuhan ko at nais ang camera at talagang binili ang camera ay makakakuha pa rin ako ng mga ad na naghihikayat sa akin na bilhin ang camera. Malaking data!
Ang naka-target na "malaking data" advertising ay ang pinakamalaking pag-load ng baloney, kailanman.
OK, kaya't kalimutan natin ang mga fiasco at lumipat sa paggamit ng malaking data para sa mga uso. Ang malaking data ay maaaring makahanap ng iba't ibang mga karayom sa iba't ibang mga haystacks. Kaya makakakuha ka ng isang bagay tulad nito: Apatnapung porsyento ng lahat ng mga mamimili sa Subaru ay mga vegetarian / vegan at 80 porsiyento sa kanila ay mga Demokratiko. Ngunit ang bilang na iyon ay tumaas sa 60 porsyento at 90 porsyento, ayon sa pagkakabanggit, kung pinag-uusapan natin ang tungkol sa isang Subaru Outback. Bukod dito, tumataas ito sa 99 porsyento na vegetarian / vegan at 99 porsyento Democrat kung ang kotse ay ipininta berde.
Ang mga malalaking data ng teorista ay magkakaroon ng isang araw ng patlang sa seminar kasama ang impormasyong ito. Ngunit binabalewala nito ang lahat ng mga variable na maaaring baguhin ang mga kalkulasyon at mga uso, na walang katapusang. Gaano katagal tatagal ang alinman sa mga partikular na malaking data na ito kung ang CEO ng Subaru ay magdadala hanggang sa isang pagtitipon sa isang berdeng Outback at ipinahayag na "Lahat ng mga balyena ay dapat lipulin!"?
Hindi kahit na magkano ang upang baguhin ang dinamika ng malaking konklusyon ng data. Sa kabila ng sinabi ng Amerikanong tao, ang data ay talagang bulag. Iyon ang dahilan kung bakit nakakakuha ka ng mga ad para sa mga produktong binili mo.
Malaking data ang nais mong tumalon sa mga konklusyon.
Kung may bumibili ng sampung mga libro sa kung paano gumawa ng bomba, nangangahulugan ba na nais niyang sumabog ang Federal Building? Paano kung siya ay isang eksperto sa pagtatapon ng bomba at hindi kasama sa kanyang pamagat ng trabaho bilang consultant ng pulisya? Hindi alam ng malaking data ang lahat, gayon pa man. Hindi nito malalaman kung ano ang iniisip mo. Iniisip ko, halimbawa, na ang kamera ng Bogus One ay sumuko. Hindi malalaman ng malaking data na maliban kung naiinterog ako. At baka magsinungaling ako.
Wala sa mga ito tunog na mabuti o malusog para sa lipunan. Tumalon sa mga konklusyon, paggawa ng mga pagpapalagay, kumikilos sa maling mga pagpapalagay. Ang pagyuko sa publiko ng walang silbi s.
Malaking data bilang isang mataas na konsepto ay hindi kailanman ganap na tukuyin ang sarili at mamamatay ng isang kahabag-habag na kamatayan. Sana.