Talaan ng mga Nilalaman:
- 1. Huwag Kalimutan ang Logistik
- 2. Isipin ang Iyong Data
- 3. Ang mga Algorithms Ay Hindi Mga Magic Bullet
- 4. Gumamit ng isang Diverse Toolset
- 5. Eksperimento Sa Pag-aaral ng Hybrid
- 6. Murang Hindi nangangahulugang Masamang
- 7. Huwag Tawagan Ito AI
Video: 7 BAGAY Na Hindi GINAGAWA At INIIWASAN Ng Mga MAYAYAMAN (Nobyembre 2024)
Ang unang bahagi ng aming Gabay sa Negosyo sa Pag-aaral ng Machine (ML) ay sinira kung paano ang konsepto ng payong ng ML ay higit na napapalala sa isang kapaligiran sa negosyo. Ang pinaka-epektibong mga diskarte ay tumingin sa ML sa isang praktikal na kahulugan, gumagamit ng parehong kumplikadong malalim na pag-aaral at hindi gaanong masinsinang mga "murang pag-aaral" na mga diskarte upang ma-optimize ang mga proseso ng negosyo at makakuha ng mga nasasalat na pananaliksik sa negosyo (BI).
Ang layunin ng pag-aalis ng ML sa loob ng iyong mga aplikasyon ng negosyo ay upang mapagbuti ang iyong ilalim na linya o pindutin ang mapagkumpitensya na kalamangan ng iyong kumpanya. Ngunit sa mas malaking pamamaraan ng iyong samahan, na ginagawa ang halos lahat ng oras at mga mapagkukunan na namuhunan ka sa prosesong ito ay higit pa sa mga algorithm. Ang mga gumagawa ng desisyon ng IT sa iyong negosyo ay kailangang tiyakin na ang lahat na nagpapatotoo sa iyong pagpapahiwatig sa ML - mula sa data at logistik hanggang sa kung paano ka nakikipag-ugnayan sa mga gumagamit - ay gumagana nang magkakasamang magkakasama upang mapakinabangan ang pagiging epektibo.
Si Ted Dunning, Ph.D., ay ang Punong Arkitekto ng Application sa MapR, isang kumpanya ng software ng kumpanya na nag-aalok ng iba't ibang mga pamamahagi ng Big Data at mga tool sa pamamahala ng data. Si Dunning ay may kasamang may-akda ding dalawang libro sa tinutukoy niya bilang "Practical Machine Learning" at binuo ang mga teknolohiya ng ML para sa isang bilang ng mga kumpanya sa mga nakaraang taon, kasama ang system ng pandaraya ng pandaraya ng ID Analytics (binili ng LifeLock) at ang Musicmatch Jukebox software, na kalaunan ay naging Yahoo Music. Kasalukuyan din siyang nagsisilbing Bise Presidente ng Incubation para sa Apache Software Foundation.
Napanood ng Dunning ang puwang ng ML na umuusbong sa maraming mga dekada, at maraming natutunan tungkol sa kung ano ang gumagana at kung ano ang hindi sa isang praktikal na kapaligiran sa negosyo. Sa ibaba, inilalagay ni Dunning ang pitong pinakamahusay na kasanayan na sundin kapag nabuo ang mga solusyon sa negosyo na nakaugat sa ML.
1. Huwag Kalimutan ang Logistik
Ang matagumpay na ML ay hindi lamang tungkol sa pagpili ng tamang tool o algorithm. Sinabi ni Dunning na kailangan mo ring malaman kung ano ang diskarte ay isang mahusay na akma at idisenyo ito para sa partikular na sitwasyon na iyong tinutugunan. Halimbawa, napag-usapan ni Dunning ang tungkol sa ML sa isang kampanya sa pagmemerkado sa online kumpara sa mas kumplikadong mga sitwasyon tulad ng mga algorithm na gumagabay sa isang awtonomikong kotse. Ang paggastos ng iyong mga mapagkukunan para sa isang pagtaas ng pagpapabuti ng algorithm ay nagkakahalaga ng problema para sa kotse, ngunit sa sitwasyon ng marketing, makikita mo ang isang mas mahusay na pagbabalik mula sa pag-optimize ng lahat ng mga logistik sa paligid nito.
"Kadalasan, para sa mga negosyo, ito ang logistik, hindi ang pag-aaral, na nagbibigay sa iyo ng halaga. Iyon ang bahagi na dapat mong paggastos ng iyong oras at mga mapagkukunan, " sabi ni Dunning. "Ang pag-aayos ng algorithm ay magbibigay sa iyo ng isang maliit na pagpapabuti. Ngunit ang pag-aayos ng data na iyon, ang GUI, at kung paano ka nakikinig at nakikipag-ugnayan sa iyong mga gumagamit ay madaling magbigay sa iyo ng isang 100 porsiyento na pagpapabuti. Ang paggugol ng oras sa pag-tweak ng algorithm ay nagkakahalaga ng isang bahagi marami sa mga negosyo tulad ng pakikinig sa iyong mga gumagamit. "
Upang mailarawan ang puntong ito, ipinaliwanag ni Dunning kung paano niya itinayo ang isang modelo para sa pagkilala sa pandaraya ng aplikasyon (pagbubukas ng mga pekeng account na may ninakaw na pagkakakilanlan) sa database ng customer ng isang kumpanya. Ang modelo na itinayo niya ay nakakakuha ng mahusay na mga resulta, ngunit napansin ni Dunning na bigat nito ang bigat ng kasarian ng aplikante.
Ito ay naka-off na ang logistik ay naka-off. Ang paraan ng proseso ng aplikasyon, pinuno lamang ng aplikante ang kanilang kasarian matapos na sila ay naging isang customer at naipasa ang isang bilang ng mga hakbang sa screening upang ma-filter ang mga manloloko. Kaya sa pamamagitan ng paggamit ng larangan ng kasarian, ang modelo ng ML ay niloloko ang logistik ng buong proseso ng pandaraya. Iyon ay walang kinalaman sa algorithm, at lahat ng gagawin sa kung paano nakuha ng kumpanya ang data nito sa unang lugar.
2. Isipin ang Iyong Data
Ang Dunning ay puno ng mga nakamamanghang balita ng karunungan. Matapos simulan ang "ito ang logistik, hindi ang pag-aaral, " sinabi niya ang iba pang kalahati ng ideyang iyon ay "ito ang data, hindi ang mga algorithm." Ang isang malaking bahagi ng pagtiyak na ang iyong ML algorithm ay naghahatid ng mahalagang pananaw ay tinitiyak na pinapakain mo sila ng tamang data. Sinabi ni Dunning, kung hindi ka nakakakuha ng resulta kung saan mo hinahanap, mas madalas kaysa sa hindi dahil hindi ka gumagamit ng tamang data.
"Nasusuklian ng mga tao ang lahat at ang mga ego-bound sa mga partikular na algorithm, ngunit sa kasalukuyan, dahil sa mga tool sa labas, ang lahat at ang kanilang ina ay maaaring at sumasabay sa lahat ng uri ng mga bagong algorithm, " sabi ni Dunning. "Ang data ay mas mahalaga, at bibigyan ka ng higit na higit na pag-angat kaysa sa walang katapusang pag-tweaking ng iyong mga algorithm. Kung nagtatrabaho ka sa isang mahirap na problema tulad ng pagkilala sa pagsasalita o pangitain sa computer, isang bagay ito. Ngunit ito ay isang patlang na hinihimok ng data. Sa karamihan ng mga sitwasyon, makikinabang ka pa sa pag-aayos ng kung ano ang data na nakukuha mo at binabago ang tanong. "
Iyon ang ginawa ni Dunning noong kalagitnaan ng 2000 noong nagtatayo ng isang video rekomendasyon sa video sa isang kumpanya na tinatawag na Veoh Networks. Nagtatrabaho ang koponan upang makilala ang mga pares ng mga video na nabuo ng gumagamit na na-click ng mga tao nang higit pa sa inaasahan, ngunit hindi gumagana ang algorithm. Iniisip nila sa mga tuntunin ng musika, kung saan alam ng mga gumagamit ang kanilang mga paboritong artista at kanta sa pangalan. Kaya binago nila ang tanong sa pamamagitan ng pag-tweet ng interface ng gumagamit nang hindi hawakan ang algorithm mismo.
"Sa mga video na binuo ng gumagamit, walang nakakaalam ng mga artista at maraming mga video ay talagang may mga pamagat ng spammy upang makakuha ng higit pang mga view. Ang pagbibisikleta sa mga pag-tweak ng algorithm ay hindi kailanman bibigyan kami ng magagandang resulta, " sabi ni Dunning. "Ang ginawa namin ay binago ang interface ng gumagamit upang magpalabas ng isang signal ng beacon tuwing 10 segundo. Nalaman namin na kung ginamit namin ang beacon sa halip na mga pag-click para sa hilaw na data ng nagrekomenda, nakakuha kami ng mga kahanga-hangang resulta. Ang pag-angat para sa isang pagbabago na ito ay ilang daang porsyento na pagpapabuti sa pakikipag-ugnay dahil sa mga rekomendasyon, na walang mga pagbabago sa algorithm. "
3. Ang mga Algorithms Ay Hindi Mga Magic Bullet
Ang pagpapatupad ng ML ay nagtatagumpay sa patuloy na pagsubok at pagkakamali. Hindi mahalaga kung gaano kahusay ang iyong mga algorithm, kung ang iyong system ay nakikipag-ugnay sa mga tao, kung gayon kakailanganin itong ayusin sa paglipas ng panahon. Binigyang diin ni Dunning na ang mga negosyo ay dapat na patuloy na pagsukat sa pangkalahatang pagiging epektibo ng kanilang pagpapatupad, at pagkilala sa mga pagbabago at variable na ginagawang mas mahusay at ginagawang mas masahol pa. Ito ay maaaring tunog tulad ng isang malaking kadahilanan, ngunit sinabi ni Dunning, kahit na gaano ito kamahal, kakaunti ang mga tao na ginagawa ito o mahusay na ginagawa.
"Maraming tao ang nais na mag-deploy ng isang system o gumawa ng ilang aksyon, at nais nila na ang kanilang algorithm ay tumakbo nang perpekto magpakailanman, " sabi ni Dunning. "Walang algorithm ay magiging isang magic bullet. Walang disenyo ng interface ng gumagamit ay mananatili magpakailanman. Walang paraan ng pagkolekta ng data ay hindi kailanman mapapalit. Ang lahat ng ito ay magaganap at magaganap, at ang mga negosyo ay kailangang maging maingat na pagsukat, pagsusuri, at muling pagsusuri kung paano ang kanilang gumagana ang system. "
4. Gumamit ng isang Diverse Toolset
Mayroong dose-dosenang mga tool sa ML na magagamit, marami sa kung saan maaari mong gamitin nang libre. Nakakuha ka ng mga tanyag na aklatan ng open-source frameworks tulad ng Caffe, H20, Shogun, TensorFlow, at Torch, at ML library sa isang bilang ng mga proyektong Apache Software Foundation (ASF) kabilang ang Mahout, Singa, at Spark. Pagkatapos ay may mga pagpipilian na batay sa subscription kasama ang Amazon Machine Learning, BigML, at Microsoft Azure Machine Learning Studio. Ang Microsoft ay mayroon ding isang libreng Cognitive Toolkit.
Maraming mga mapagkukunan na magagamit. Si Dunning ay nagsalita sa maraming mga negosyo, data scientist, at ML practitioners, at laging tinatanong sa kanila kung gaano karaming iba't ibang mga frameworks at tool na ginagamit nila. Sa karaniwan, sinabi ni Dunning na karamihan ay nagsabing gumagamit sila ng isang minimum na mga tool sa 5-7 at madalas na higit pa.
"Hindi ka maaaring nakadikit sa isang tool. Kailangan mong gumamit ng maraming, at dahil dito, mas mahusay mong itayo ang iyong system sa paraang ito ay agnostiko, " sabi ni Dunning. "Sinumang sumusubok na kumbinsihin ka na ang tool na ito ay ang tanging kakailanganin mo ay ang pagbebenta sa iyo ng isang bill ng mga kalakal.
"Maaaring mangyari sa susunod na linggo na nag-aangat sa karton ng mansanas, at sa rate ng pagbabago na nakikita natin, ito ay patuloy na mangyayari para sa isa pang lima hanggang 10 taon na hindi bababa sa, " patuloy ni Dunning. "Tumingin sa isang murang halimbawa ng pag-aaral kung saan marahil ay gumagamit ka ulit ng isang umiiral na classifier ng imahe upang pag-aralan ang mga larawan sa isang katalogo. Malalim na pag-aaral na iyon ng computer vision na itinapon. Ngunit may mga tool sa labas na nakabalot ng lahat. Kailangan mo upang masukat, suriin, at magbakasyon sa pagitan ng iba't ibang mga kasangkapan, at ang iyong imprastraktura ay kailangang maging maligayang pagdating doon. "
5. Eksperimento Sa Pag-aaral ng Hybrid
Sinabi ni Dunning na maaari mo ring ihalo ang murang at malalim na pag-aaral nang magkasama sa isang bagay na isang mestiso. Halimbawa, kung kumuha ka ng isang umiiral na modelo ng pangitain sa computer at muling itayo ang nangungunang ilang mga layer kung saan ginagawa ang isang desisyon, pagkatapos ay maaari kang pumili ng isang umiiral na balangkas para sa isang ganap na bagong kaso sa paggamit. Itinuro ni Dunning ang isang Kaggle na kumpetisyon kung saan ginawa lamang ng mga paligsahan; kumuha sila ng isang set ng data at nagsulat ng isang bagong algorithm sa itaas upang matulungan ang isang computer na makilala ang mga pusa sa mga aso.
"Ang pagkakaiba-iba ng mga pusa at aso ay isang napaka banayad na bagay para sa isang algorithm ng ML. Pag-isipan ang lohika: Ang mga pusa ay may mga tainga na tainga ngunit gayon din ang Aleman na mga Pastol. Ang mga aso ay walang mga spot, maliban sa Dalmatian, atbp Na maaaring medyo mahirap makilala sa at ng kanyang sarili, "sabi ni Dunning. "Ang taong nanalo ay bumuo ng isang sistema na ginawa ito na may 99 na porsyento na katumpakan. Ngunit mas humanga ako sa taong pumapasok sa ikatlo. Sa halip na magtayo mula sa simula, kumuha siya ng isang umiiral na programa sa pagkilala sa imahe mula sa ibang gawain, kinuha ang tuktok na layer, at ilagay ang isang simpleng klasipikasyon doon. Binigyan niya ito ng ilang mga halimbawa, at sa lalong madaling panahon, 98 porsiyento na tumpak sa pagkakaiba-iba ng mga pusa mula sa mga aso. Ang buong proseso ay kinuha ng lalaki ng tatlong oras. "
6. Murang Hindi nangangahulugang Masamang
Sa kabila ng labis na konotasyon, sinabi ni Dunning na ang murang pag-aaral ay hindi nangangahulugang masamang pagkatuto. Ang halaga ng oras na ginugol mo sa isang pagpapatupad ng ML ay hindi direktang nauugnay sa halaga ng negosyo nito. Ang mas mahalagang kalidad, aniya, ay tiyakin na ang proseso ay maulit at maaasahan. Kung ang negosyo ay makakamit na nang walang pamumuhunan ng hindi nararapat na halaga ng mga mapagkukunan, kung gayon mas mabuti ang lahat.
"Ang mura ay hindi nangangahulugang masama. Kung ito ay gumagana, gumagana ito. Kung mura ito at gumagana, iyon ang grand. Ngunit ang pagsisikap na iyong inilagay sa gusali ay hindi nito tinukoy ang halaga. Iyon ay isang kabiguan sa kabuuan, " sabi ni Dunning . "Ang tumutukoy sa halaga ay kung paano ito nagpapabuti sa negosyo. Kung ang nagpapabuti ng kita o bumaba ang mga gastos o nagpapabuti sa iyong mapagkumpitensyang sitwasyon. Ito ang epekto, hindi ang pagsisikap."
7. Huwag Tawagan Ito AI
Binigyang diin ni Dunning na, kapag pinag-uusapan ang mga pamamaraan na ito, dapat gamitin ng mga negosyo ang tumpak na terminolohiya: ML, pangitain sa computer, o malalim na pag-aaral. Ang lahat ng ito ay may posibilidad na mahulog sa ilalim ng payong termino na "artipisyal na katalinuhan" ngunit, kay Dunning, ang kahulugan ng AI ay "mga bagay na hindi pa gumagana."
"Ang pinakamagandang kahulugan na narinig ko para sa AI ay ito ang mga bagay na hindi namin maipaliwanag. Ang mga bagay na hindi namin naisip, " sabi ni Dunning. "Sa tuwing nakakakuha tayo ng isang bagay upang gumana, sinasabi ng mga tao na 'Oh, hindi iyon AI, ito ay software lamang. Ito ay isang patakaran na engine. Ito ay talagang pagrerebyu ng logistik.' Bago natin malaman ang isang bagay, tinawag natin ito AI.Pagkatapos nito, palaging tinatawag natin ito ng iba pa.Sa maraming mga paraan, ang AI ay mas mahusay na ginagamit bilang isang salita para sa susunod na hangganan, at sa AI, palaging may susunod na hangganan. kung saan kami pupunta, hindi kung saan nakarating kami. "