Video: The Future of Computing (Heterogeneous Architecture – CPUs, GPUs, FPGAs, ASICs, ...) (Nobyembre 2024)
Karamihan sa mga kagiliw-giliw na talakayan ng processor ay kamakailan lamang na umiikot sa paggamit ng iba't ibang uri ng chips at cores, kumpara sa mga pangkalahatang layunin na computing cores na karaniwang sa maginoo na mga CPU. Nakita namin ang lahat ng mga uri ng iba't ibang mga kumbinasyon ng mga chips na ginamit para sa partikular na mga gawain sa pag-compute, kabilang ang mga CPU, GPUs, DSP, pasadyang ASICS, at mga arrays ng gate na maaaring ma-program (FPG), at lalong nakikita namin ang mga application na pagsamahin ang mga aspeto ng lahat ng ito, kung minsan sa isang system at kung minsan sa loob ng isang maliit na chip.
Kahit na ang Intel-mahaba ang proponent ng pangkalahatang-layunin na mga compute na mga cores na dumoble sa bilis bawat pares ng taon - ay nakakuha ng pagkilos sa pagbili nito ni Altera, isa sa mga nangungunang tagagawa ng FPGA. Kamakailan lamang, nagkaroon ako ng pagkakataon na makipag-usap kay Dan McNamara, pangkalahatang tagapamahala ng Programmable Solutions Group (PSG) ng Intel - na kung saan ay dating kilala bilang Altera - na nagpaliwanag sa mga plano ng Intel sa lugar na ito at nagbigay ng higit pang detalye sa mga plano ng kumpanya para sa pagkonekta iba't ibang uri ng mga core at magkakaibang namatay nang magkasama sa mga package na may mataas na bilis.
"Ang mundo ay magiging heterogenous, " sabi ni McNamara, na tandaan na mayroon na ngayong pangkaraniwang pagsasakatuparan na hindi mo malulutas ang lahat ng mga problema sa mga pangkalahatang gamit na cores. Ang mga pasadyang ASICs - tulad ng Tensor Processing Units o TPUs ng Google ay maaaring mapabilis ang ilang mga uri ng pag-andar na higit sa tradisyunal na CPUS o GPU, ngunit ang mga ito ay tumatagal ng mahabang panahon upang lumikha. Sa kaibahan, aniya, pinahihintulutan ng mga FPGA para sa napapasadyang code na nagbibigay ng higit sa mga benepisyo sa pagganap ng mga ASIC nang hindi naghihintay ng dalawang taon para sa disenyo ng chip at pagmamanupaktura. Maaaring baguhin ng isang developer ang mga algorithm sa loob ng isang FPGA kaagad, habang ang isang CPU, GPU, o pasadyang chip ay gumagana sa isang maayos na paraan.
Sinabi rin ni McNamara na ang mga FPGA ay napakababang latency at maaaring lubos na kahanay, na may iba't ibang bahagi ng isang chip na nagtatrabaho nang sabay-sabay sa mga aplikasyon tulad ng pagproseso ng imahe o komunikasyon.
Ipinapadala ngayon ng Intel ang Arria 10 FPGA, na gawa sa proseso ng 20nm ng TSMC, at nag-aalok ng isang pakete na pinagsasama ang isang Xeon (Broadwell) processor at ang Arria 10. Ginagamit ito sa mga aplikasyon tulad ng paghahanap sa web at analytics. Sinabi ni McNamara na ang FPGA ay maaaring mapabilis ang paghahanap ng hanggang sa 10 beses at nabanggit na ang Microsoft ay naging pampubliko tungkol sa paggamit ng mga naturang FPGA upang mapabilis ang paghahanap.
Isang malaking lugar ng pagpapabuti kani-kanina lamang ay ang paglikha ng mas mabilis na mga pakete ng multi-chip na maaaring pagsamahin ang namatay ng chip na nilikha sa iba't ibang mga proseso at marahil mula sa iba't ibang mga gumagawa. Kasama dito ang mga pakete na naglalaman ng isang CPU at isang FPGA, tulad ng kumbinasyon ng Xeon / Arria; isang FPGA na may iba't ibang mga transceiver, tulad ng sa Intel's Stratix 10 FPGA; o kahit na iba't ibang mga bahagi ng isang buong CPU, tulad ng inilarawan ng Intel sa pinakabagong teknolohiya at araw ng pagmamanupaktura.
Ang Intel ay lumikha ng isang bagong teknolohiya na tinawag na naka-embed na multi-chip na magkakaugnay na tulay (EMIB) upang gawin ito, na nagpasya sa Stratix 10. Sa EMIB, ang core die ay nilikha sa proseso ng 14nm ng Intel at ang mga transceiver sa proseso ng 16nm ng TSMC.
Sa pangkalahatan, sinabi ni McNamara na maraming mga lugar ang lumilipat patungo sa pag-ampon ng higit pang mga FPGA gamit ang naturang packaging. Pinag-uusapan niya ang tungkol sa mga hyper-scale web site, na nakikita ang mabilis na pagbabago ng demand at kung saan ang isang kumbinasyon ng FPGA / CPU ay maaaring gumana nang maayos sa mga lugar tulad ng paghahanap, analytics, at video streaming, pati na rin ang pagbabagong-anyo ng network, kung saan ang mga trend tulad ng software na tinukoy ng software at virtualization ng mga function ng network ay nagmamaneho ng isang pangangailangan para sa higit pang pagproseso ng packet. Ang iba pang mga lugar na pokus ay kinabibilangan ng 5G at mga wireless na aplikasyon, autonomous driving, at artipisyal na intelligence (AI) na aplikasyon. Sa AI, sinabi ni McNamara na na-optimize ang mga ASIC at ang raw computer power ay maaaring maging pinakamahusay para sa pagsasanay (binili ng Intel ang Nervana), ngunit sinabi ng mga FPGA ay madalas na mas mahusay sa pag-iintindi, dahil sa kanilang kakayahang umangkop at mababang-latency, at nabanggit na ginamit ng ZTE ang Arria 10s sa magpakita ng mga nakamamanghang marka ng pagkilala sa imahe.
Personal, interesado akong makita kung ang mga hinaharap na mga CPU ay kukuha ng iba't ibang mga sangkap at ihalo at tutugma ang mga ito gamit ang EMIB o isang katulad na teknolohiya upang mabago ang iniisip natin bilang isang chip ng processor. Naintriga ako sa ideya na ang mga system ng hinaharap ay maaaring gumamit ng maraming iba't ibang mga cores - ang ilang mga programmable (FPGA) at ilang mga nakapirming (isang halo ng parehong mga pasadyang ASIC at tradisyunal na mga CPU at GPU) upang gawin ang mga bagay na magkasama na mapagbuti sa kung ano ang iisang solong ang teknolohiya ay maaaring gawin sa sarili nitong.