Video: 2020 Seminar Series: Intro to Supercomputing (Nobyembre 2024)
Mayroong ilang mga sorpresa sa buwanang Supercomputing 17 na komperensya, kabilang ang isang napakahusay na pagpapakita para sa accelerator ng PEZY-SC2, pati na rin ang pagbabago ng Intel sa direksyon para sa linya ng Xeon Phi. Bilang karagdagan, nakita din namin ang mga unang sistema na itinayo sa Intel's Xeon Scalable Processor (Skylake) at ang una na nagtatampok ng accelerator ng Volta ng Nvidia.
Ngunit marahil ang pinaka-kapansin-pansin ay ang balita na ang mga sistemang Tsino ay nagkakaroon ngayon ng 202 sa 500 supercomputers sa pinakabagong listahan ng Top 500 kumpara sa 143 lamang mula sa US. Pinamunuan ng mga sistemang Amerikano ang listahan mula noong ito ay umpisa 25 taon na ang nakalilipas, at ilang buwan na ang nakalilipas, ang US ay mayroong 169 na mga sistema sa 160 ng Tsina. Katulad din ito pagdating sa pinagsama-samang pagganap, kasama ang mga sistemang Tsino na pinagsama ang accounting ng 35.4 porsyento ng ang kabuuang pagganap ng Nangungunang 500 system.
Ang pinakamabilis na computer sa mundo ay nagpapatuloy na ang dalawang napakalaking Chinese machine na nanguna sa listahan ng maraming taon ngayon: Sunway TaihuLight, mula sa National Supercomputing Center ng China sa Wuxi, na may matagal na pagganap ng Linpack na higit sa 93 petaflops (93 libong trilyong lumulutang na punto operasyon bawat segundo), at ang Tianhe-2, mula sa National Super Computer Center ng China sa Guangzhou, na may matagal na pagganap ng higit sa 33.8 petaflops. Ito ay nananatiling pinakamabilis na machine, at sa pamamagitan ng isang malaking margin. Ang sistemang Piz Daint mula sa Swiss National Supercomputing Center, isang sistema ng Cray na gumagamit ng Intel Xeons at Nvidia Tesla P100s, na gaganapin sa ikatlong lugar kasama ang napapanatiling pagganap ng Linpack na 19.6 petaflops.
Ang pinakamalaking pagbabago sa tuktok ay isang bagong sistema sa ika-apat na lugar: isang na-upgrade na bersyon ng Gyoukou supercomputer, isang ZettaScaler-2.2 system na naitatapon sa Ahensya para sa Marine-Earth Science and Technology. Ang makina na ito ay gumagamit ng mga accelerator ng PEZY-SC2, isang pangalawang henerasyon na 2048-core chip na nagbibigay ng isang rurok na pagganap ng 4.096 teraflops sa dobleng katumpakan, pati na rin ang maginoo na mga processor ng Intel Xeon, para sa isang kabuuang 19, 860, 000 na mga cores. (Ang isang mas maagang ZettaScaler machine kasama ang PEZY-SC2 ay gumawa ng listahan sa isang mas mababang antas sa bersyon ng Hunyo). Ibinibigay nito ang pinakamataas na bilang ng mga cores na ginamit nang magkasama - na kilala rin bilang pinakamataas na antas ng pag-akma - na nakikita hanggang sa kasalukuyan, higit sa TaihuLight, na mayroong 10.6 milyong mga cores. Nakamit ng makina Gyoukou ang isang napapanatiling pagganap ng Linpack na 19.14 petaflops, ngunit ang nakakainteres ay gumagamit ito ng 1.35 megawatts ng kapangyarihan, kumpara sa 2.27 megawatts para sa PizDaint, 17.8 megawatts para sa Tinahe-2, at 15.4 megawatts para sa Taihulight. Iyon pa rin ang maraming kapangyarihan, ngunit isang malaking pagbawas kumpara sa iba pang mga sistema at isang malakas na pahiwatig na ang mga alalahanin ng kapangyarihan ay mahalaga, kahit na para sa pinakamabilis na makina sa buong mundo. Nararapat din na tandaan na ipinapakita nito kung paano ang mga bagong arkitektura ay maaaring mabawasan ang lakas na gumuhit nang malakas.
Ang nangungunang sistema ng US ay nananatiling Titan supercomputer sa Oak Ridge National Laboratory, isang limang taong gulang na sistema na gumagamit ng mga accelerator ng Nvidia K20x GPU at naghahatid ng 17.59 petaflops, na ngayon ay nasa ika-limang lugar sa listahan.
Sa pinakabagong listahan ng Green 500 ng pinaka-mahusay na supercomputers ng enerhiya, apat sa mga nangungunang limang mga puwang - kabilang ang nangungunang tatlong-napunta sa mga bagong naka-install na mga sistema ng Hapon, lahat batay sa arkitektura ng ZettaScaler-2.2 at ang accelerator ng PEZY-SC2. Ang pinaka mahusay sa mga ito ay ang Shoubu System B, na naka-install sa Advanced Center para sa Computing at Komunikasyon ng RIKEN. Nakamit ng Shoubu System B ang 17.0 gigaflops / watt; Ang Shoubu System B at ang susunod na dalawang system, na gumagamit ng 16.8 at 16.7 gigaflops / watt ayon sa pagkakabanggit, lahat ay nasa ilalim ng kalahati ng listahan ng Nangungunang 500. Ang ikalimang sistema sa ranggo ng Green ay ang sistemang Gyoukou na nabanggit sa itaas - ang numero ng apat na sistema sa listahan ng Nangungunang 500, sa 14.2 gigaflops / watt.
Ito ang mga malalaking breakthroughs para sa PEZY-SC2 accelerator, at maaaring ituro sa mga direksyon sa hinaharap para sa mga supercomputing na arkitektura.
Ang ikaapat na greenest supercomputer ay ang panloob na DGX SaturnV Volta system ng panloob na Nvidia, na nakamit ang 15.1 gigaflops / watt, at dumating sa 149 sa Nangungunang 500 listahan. Ang sistemang ito ay may 22, 440 Volta cores (na tila nabibilang sa medyo kakaibang paraan sa listahan kaysa sa ilan sa mga iba pang mga cores.) Nvidia ay nagkakaroon ng isang napakagandang taon para sa accelerator nito, at may mataas na pag-asa para sa higit pang mga makina na gumagamit ng Volta Arkitektura ng GPU.
Tulad ng dati, ang mga pangunahing nagtitinda ay dumadaloy tungkol sa kanilang mga tagumpay sa listahan, kasama ang Intel na ang mga CPU nito ay nasa anim sa nangungunang sampung sistema at isang mataas na talaan na 471 sa 500 na mga sistema. Nabanggit din ng Intel na ang mga bagong Proseso ng Xeon Scalable Processors ay nasa 18 supercomputers na may higit sa 25 petaflops ng pagganap. Ngunit kung ano ang maaaring maging kapansin-pansin ay sinabi ng Intel na kinansela nito ang Knights Hill, ang binalak na 10nm na kahalili sa 14nm Knights Landing Xeon Phi processor. Sinabi ng kumpanya na ngayon ay nagpaplano ito ng isang bagong platform para sa mga magagandang sistema (1, 000 petaflops) sa 2021, ngunit hindi ibinahagi ang anumang mga detalye.
Binigyang diin ni Nvidia na mayroon itong 34 bagong sistema kasama ang mga accelerator nito sa listahan, na nagdala ng kabuuang kumpanya ng 87. Si Nvidia at kasosyo na IBM ay nagugutom tungkol sa posibilidad na, sa oras na ang susunod na listahan ay dapat na sa Hunyo, ang Summit machine sa Oak Ridge Ang National Laboratory (ORNL) ay dapat na kabilang sa mga makina sa tuktok ng listahan. Ang makina na ito ay nagtatampok ng 4600 node, bawat isa ay may dalawang mga batayang IBM Power 9 na base at 6 na Nvidia Volta accelerators, na may inaasahang pagganap ng halos 200 petaflops. Ito ay naiiba mula sa panloob na solusyon ng Nvidia, na ang mga CPU at GPU lahat ay nakikipag-usap sa NVLink 2.0 sa isang paraan na magkakaugnay ng cache gamit ang OpenCAPI, kaya ang mga GPU ay maaaring direktang ma-access ang pangunahing system RAM. Ang summit ay susundan ng makina ng Sierra sa Lawrence Livermore National Laboratory, at sa pamamagitan ng makina ng AI Bridging Cloud Infrastructure (ABCI) sa Japan.
Ako ay interesado na marinig ang Cray na nagpapahayag ng isang "production-handa" na supercomputer batay sa Cavium ThunderX2 processor sa 64-bit Armv8-A arkitektura, magagamit na ngayon bilang bahagi ng XC50 supercomputer. Ang mga makina na nakabase sa ARM ay sinubukan sa Barcelona Supercomputer Center (na ang makina ng Mare Nostrum ay nasa ranggo na bilang 16 sa Top Top list), pati na rin ang "Post-K" supercomputer sa Japan at ang Isambard supercomputer sa UK. Ang Cavium ay nagkaroon ng ilang mga maagang benchmark sa ThunderX2, na ipinakita ang 14nm chip na gumaganap nang mas mahusay sa mga multi-sinulid o mga application na nakatali sa memorya kaysa sa Skylake Xeons ng Intel, bagaman ang Intel ay nananatiling pinuno sa single-threaded at sa mga hilaw na teraflops. Tandaan na bilang karagdagan sa disenyo ng Cavium, inihayag din ng Qualcomm ang isang ARM na batay sa server chip na tinatawag na Centriq.
Sa iba pang mga balita ng processor, inihayag ng AMD na rampa ang produksyon ng mga processors nito sa Epyc, kahit na ang mga ito ay wala pa sa anumang Nangungunang 500 system, habang inihayag ng NEC ang mga bersyon ng Vector Engine na PCIe accelerator card para sa kanyang bagong SX-Aurora TSUBASA supercomputer series, na kung saan magkaroon ng isang partikular na mabilis na bandwidth ng memorya.
Sa panig ng mga interconnect, sinabi ni Mellanox na 77 porsyento ng mga bagong sistema sa listahan ng Top 500 ang gumagamit ng InfiniBand, habang ang Intel ay touted kamakailan ang mga tagumpay kasama ang Omni-Path Architecture, na kadalasang ginagamit sa mga Xeon Scalable Processor (Skylake) system. Samantala, ang isang bilang ng mga nagtitinda ay naghahanap sa Gen-Z, na idinisenyo upang maging isang mas mababang latency, memory-sentrik na diskarte para sa napakabilis na koneksyon sa pagitan ng compute at memorya / imbakan na aparato.
Gayundin, kagiliw-giliw na tandaan na sa unang pagkakataon, ang lahat ng mga makina sa Nangungunang 500 ay tumatakbo na ngayon sa Linux.
Sa pagitan ng malakas na unang impression mula sa PEZY-SC2, ang desisyon ng Intel na ibagsak ang Knights Mill para sa isang bagong arkitektura, ang Nvidia's Volta, at bagong kumpetisyon mula sa AMD, ARM vendor, at NEC, ngayon ay isang kapanapanabik na oras sa mundo ng supercomputing. Ang mga listahan ng susunod na taon ay dapat na medyo kawili-wili, dahil nakikita natin kung aling mga arkitektura ang talagang gumanap, at kung saan ay pinaka-mahusay, tulad ng maraming mga vendor at mga supercomputer na site na sumusubok na iposisyon ang kanilang sarili sa karera upang makabuo ng isang exascale (1000 petaflop) computer na may isang sub -20 megawatt power draw.
Nagtataka sa iyong bilis ng broadband sa internet? Subukan ito ngayon!