Video: 2020 Seminar Series: Intro to Supercomputing (Nobyembre 2024)
Habang tinitingnan ko ang mga anunsyo at paglilitis ng kumperensya ng Supercomputing 15 (SC15) noong nakaraang buwan sa Austin, lumilitaw na habang ang mataas na pagganap ng computing ay maaaring maging isang maliit, ito ay isang merkado na umusisa para sa ilang malalaking pagbabago sa taon hanggang darating.
Kung titingnan mo ang mga pinuno sa listahan ng top500, ang dalawang beses na taunang listahan ng pinakamabilis na computer sa mundo, ang pinuno para sa ikaanim na sunud-sunod na oras ay ang Tianhe-2, isang superkomputer na itinayo ng National University of Defense Technology ng China. Ayon sa listahan ng top500, ang makina na ito ay naghahatid ng 33.86 petaflop / s (quadrillions ng mga kalkulasyon bawat segundo) ng napapanatiling pagganap sa benchmark ng Linpack at 54.9 petaflop / s ng teoretikal na pagganap ng rurok. Ito ay batay sa mga Intel Xeon at Xeon Phi processors.
Ang pangalawang lugar ay patuloy na pumunta sa Titan, isang sistema ng Cray XK7 batay sa mga AMD Opteron CPU at Nvidia K20x GPU na na-install sa Oak Ridge National Laboratory ng DOE, sa 17.59 petaflop / s ng matagal na pagganap sa benchmark ng Linpack.
Dalawang bagong machine ang pumutok sa tuktok 10. Ang Trinity computer sa Lawrence Livermore National Laboratory (LLNL) ay pang-anim na may 8.1 petaflop / s, habang ang sistema ng Hazel-Hen sa Höchstleistungsrechenzentrum Stuttgart (HLRS) ay dumating sa ikawalong may 5.6 petaflop / s. Parehong mga Cray XC machine, batay sa mga processor ng Intel Xeon na may magkakaugnay na Aries.
Malaking pagbabago ang nagaganap nang mas malayo sa listahan, lalo na sa isang malaking pagtaas ng bilang ng mga sistemang Tsino, na tumaas sa 109, kung ihahambing sa 37 lamang sa nakaraang listahan. Sa bahagi, tila ito ay mula sa higit pang mga sistemang Tsino na nagpapatakbo ng mga benchmark at pagsusumite ng mga resulta para sa listahan. Bilang isang resulta, ang bilang ng mga sistema ng US ay bumaba mula 231 hanggang 200, na siyang pinakamababang bilang mula nang magsimula ang listahan noong 1993; at ang bilang ng mga European system ay bumaba mula 141 hanggang 108.
Ang isang malaking kalakaran ay isang pagtaas sa bilang ng mga system na gumagamit ng mga accelerator o coprocessors, na tumaas sa 104 na mga sistema sa kasalukuyang listahan, mula 90 sa Hulyo. Ang karamihan sa mga sistemang ito ay gumagamit ng Nvidia Tesla GPUs, na sinundan ng mga coprocessor ng Intel Xeon Phi, na may iilan na gumagamit ng isang kumbinasyon. Itinuro ni Nvidia na nasa 70 sa mga sistemang ito, kasama ang 23 sa 24 na bagong sistema sa listahan.
Sa palabas, na-highlight ni Nvidia ang paglaki ng mga accelerator, at lalo na ang bilang ng mga aplikasyon na magagamit na ngayon na-optimize para sa arkitektura ng CUDA. Sinabi ng kumpanya na 90 porsyento ng nangungunang 10 mataas na pagganap ng computing application at 70 porsiyento ng nangungunang 50 ay pinabilis na ngayon. Ang isang nakakaintriga na paggamit ay para sa mga system na nagpapatakbo ng mga simulation ng panahon, isang pangunahing aplikasyon para sa high-performance computing, dahil ang mga pagtataya ng panahon ay ginawa ng lahat ng mga uri ng pamahalaan. Nauna nang itinuro ni Cray ang paggamit ng mga naturang accelerator sa Swiss Meteorology Office (MeteoSwiss) at pinag-usapan ang tungkol sa kung paano ito gumagana sa mga mananaliksik sa Switzerland sa muling pagsulat ng marami sa mga aplikasyon nito. Tinutukoy ngayon ni Nvidia ang paggamit ng mga accelerator ng National Oceanic and Atmospheric Administration (NOAA) para sa ilang mga pagtataya ng panahon din.
Kabilang sa iba pang mga aplikasyon, ang Cray touted langis at gas application, tulad ng paggamit ng 3D geophysics upang gayahin ang isang reservoir, pati na rin ang mga serbisyo sa pananalapi, tulad ng pagtatasa ng peligro. Ang ganitong mga application ay bihirang bumubuo ng pinakamabilis na mga sistema sa mundo, ngunit isang indikasyon na ang pagganap ng kompyuter na may mataas na pagganap ay mas malawak na papel sa mas maraming mga aplikasyon sa korporasyon. Pinag-uusapan ni Cray ang tungkol sa isang matatag na pag-unlad sa pagpapatakbo ng mas malaki at mas detalyadong mga modelo sa lahat ng mga disiplina sa pang-agham at engineering, at pagsasama-sama ng mga tradisyunal na karga sa mga analytics.
Interesado din ako sa isang anunsyo ng Linux Foundation ng isang bagong pagsisikap na tinatawag na OpenHPC, na idinisenyo upang lumikha ng mas bukas na pamantayan sa mundo ng HPC. Ito ay isang kawili-wiling ideya, at isa na tila may maraming mga malaking manlalaro na naka-sign in.
Mayroong isang bilang ng mga bagong sistema sa mga gawa. Ang IBM ay nagtatayo ng isang bagong makina na tinatawag na Summit sa Oak Ridge National Laboratories (ORNL) at isa pang tinawag na Sierra sa Lawrence Livermore National Laboratory (LLNL), na parehong batay sa mga arkitektura ng IBM Power, Nvidia Tesla GPUs, at mga koneksyon ng Mellanox. Inaasahan na maghahatid ang Summit na maghatid ng 150 hanggang 300 na peak petaflop / s, at ang Sierra sa higit sa 100 petaflop / s.
Bilang karagdagan, ang Intel at Cray ay nagtatayo ng isang bagong makina na tinatawag na Aurora, batay sa paparating na Knights Hill Intel Xeon Phi processors para sa The Argonne Leadership Computing Facility (bahagi ng Argonne National Labs), na naglalayong para sa 150 petaflops sa 2018. Lahat ng ito ay bahagi ng isang programa ng Kagawaran ng Enerhiya na kilala bilang Kolaborasyon ng Oak Ridge, Argonne, at Lawrence Livermore pambansang lab (CORAL), na naglalayong mapabilis ang pagbuo ng high-performance computing, at partikular ang proyektong FastForward 2.
Pa rin, mayroon pa rin kaming isang mahabang paraan upang pumunta sa kalsada patungo sa "exascale computing."
Samantala, mayroong maraming mga anunsyo ng processor na maaaring mag-bode nang maayos para sa hinaharap. Partikular na itinulak ni Nvidia ang paggamit ng mga supercomputers para sa mga aplikasyon ng web ng hyperscale, lalo na ang pag-aaral ng makina. Inanunsyo nito ang ilang mga medyo mas mababang mga produkto: ang board ng Tesla M40 na may 3072 CUDA cores, na sinabi nito na may kakayahang magsagawa ng hanggang sa 7 single-precision teraflop / s, na naglalayong pangunahin sa "malalim na pag-aaral" na pagsasanay, at ang M4. isang mas mababang power board na may 1024 na mga cores at 2.2 single-precision teraflop / s, na maaaring magamit para sa malalim na pag-aaral ng pag-aaral pati na rin ang mga bagay tulad ng pagproseso ng imahe at video. Bilang karagdagan, inihayag ng kumpanya ang isang bagong "hyperscale suite" na may mga application na naglalayong sa pinakamalaking mga site ng computing. Parehong mga bagong produkto ng hardware ay batay sa teknolohiya ng proseso ng 28nm at arkitektura ng kumpanya ng kumpanya.
Inanunsyo ng kumpanya ang dalawang follow-on na mga arkitektura, na kilala bilang Pascal, dapat na sa susunod na taon, at Volta, na susundin ito. Nakatuon ang Intel sa kung paano nakakaapekto ang HPC sa agham, at naintriga ako sa paglalarawan nito kung paano ito gumagamit ng sarili nitong supercomputer - na kasalukuyang niraranggo ang 99 sa tuktok na 500 listahan - upang matulungan ang disenyo ng sarili nitong mga processors. Sa partikular na sinabi ng kumpanya na gumagamit ito ng isang milyong mga oras ng CPU para lamang idisenyo ang mga photomas para sa mga susunod na henerasyon.
Karamihan sa aktibidad ng Intel ay nakatuon sa Knights Landing, ang susunod na bersyon ng Xeon Phi chip, na maaaring magamit bilang isang accelerator ngunit din ang booting; at tela nitong Omni-Path. Kahit na sinasabi ng Intel ngayon ang pangkalahatang kakayahang magamit ay sa unang kalahati ng 2016, ang ilang mga customer ay may maagang pag-access sa Knights Landing. Sa kasalukuyan, sinusubukan ng Cray ang isang malaking sistema ng Knights Landing bilang paghahanda sa paghahatid ng isang bagong superkomputer na tinawag na Cori para sa National Energy Research Scientific Computing Center (NERSC), at Los Alamos National Laboratory at Sandia National Laboratories, sa susunod na taon. Ang Bull, isang yunit ng French system integrator Atos, ay nakatanggap din ng mga unang bersyon ng Knights Landing upang maghanda para sa Tera 1000 system na ito ay nagtatayo para sa French Alternative Energies at Atomic Energy Commission. Ang Argonne Leadership Computing Facility ay nagtatrabaho sa isang sistema na tinatawag na Theta, dahil sa paghahatid sa susunod na taon, at ang Sandia National Laboratories ay nagtatrabaho sa Penguin Computing upang mag-upgrade ng maraming mga system na gumagamit ng mga naunang henerasyon ng mga co-processors ng Xeon Phi.
Nauna nang sinabi ng Intel na magkakaroon ng tatlong magkakaibang bersyon ng Knights Landing: isang processor ng base-line host (may kakayahang self-booting), isang host processor na may isang pinagsama-samang tela na Omni-Path, at isang PCIe accelerator card. Ang chip mismo ay binubuo ng 36 tile bawat isa na may dalawang mga core ng CPU (isang kabuuang 72 mga cores), apat na yunit ng pagproseso ng vector (dalawa sa bawat core), 1MB ng ibinahaging cache ng L2, at isang ahente ng caching para sa pagpapanatili ng pagkakaisa; at sinabi ng Intel na dapat itong maghatid ng halos tatlong beses ang pagganap ng scalar ng Knights Corner CPU, na may 3 teraflop / s dobleng katumpakan at 6 teraflop / s solong katumpakan na pagganap ng rurok. Gumagamit din ito ng isang bagong sistema ng memorya na tinatawag na MCDRAM, memorya ng on-package na may higit sa 3x na magagamit na bandwidth kumpara sa pagpunta sa DDR4 na tila isang pagkakaiba-iba sa arkitektura ng Hybrid Memory Cube na pinag-usapan ng Intel at Micron tungkol dito. Sa palabas, ang Cray ay mayroong isang prototype system na nagtatampok ng isang bootable Knights Landing, at ang ilang iba pang mga vendor ay nagpapakita ng mga sistema na dinisenyo para sa Knights Landing. Ang bersyon na ito ng Xeon Phi ay isinalin na susundan ng isang bersyon na tinatawag na Knights Hill, na itatayo sa darating na proseso ng 10nm.
Bilang karagdagan, ang Fujitsu ay nakipag-usap nang kaunti pa tungkol sa proyektong Flagship 2020, batay sa isang bagong chip na kilala bilang FX100 na may 32 cores. Inaasahan na halos mag-quadruple ang pagganap ng lumulutang-point sa kasalukuyang FX10, at tulad ng Knights Landing, Fujitsu's FX100 ay gagamit din ng isang bersyon ng Hybrid Memory Cube architecture. Bilang karagdagan, ang NEC ay may isang proyekto na naka-codenamed Aurora (walang kaugnayan sa proyekto ng CORAL), batay sa follow-up nito sa SX-ACE chip ngunit may mas malaking bandwidth ng memorya. Ito ay na-target para sa 2017.