Bahay Ipasa ang Pag-iisip Nakakuha kami ng dalawang napakalaking bagong supercomputers

Nakakuha kami ng dalawang napakalaking bagong supercomputers

Video: The new supercomputer behind the US nuclear arsenal (Nobyembre 2024)

Video: The new supercomputer behind the US nuclear arsenal (Nobyembre 2024)
Anonim

Ang gobyerno ng Estados Unidos ngayon ay gumawa ng isang malaking pusta na ang mas mabilis na mga superkomputer ay makakatulong na malutas ang ilan sa mga pinakamalaking isyu sa agham, na may mga plano na magtayo ng dalawang napakalaking superkompyuter, na ang bawat isa ay magiging maraming beses nang mas mabilis kaysa sa pinakamabilis na makina ngayon.

Kasama dito ang $ 325 milyon para sa pagtatayo ng mga bagong supercomputers, kabilang ang isang bagong makina na tinatawag na Summit sa Oak Ridge National Laboratories (ORNL) at isa pang tinawag na Sierra sa Lawrence Livermore National Laboratory (LLNL), pati na rin $ 100 milyon para sa pananaliksik at pag-unlad sa matinding scale supercomputing teknolohiya sa isang programa na tinatawag na FastForward2. Inaasahan na maghahatid ang Summit na maghatid ng 150 hanggang 300 na peak petaflop / s (quadrillions ng mga kalkulasyon ng lumulutang na point bawat segundo), at ang Sierra na higit sa 100 petaflop / s kumpara sa 54.9 na peak petaflop / s ng pinakamabilis na makina (ang Tianhe-2) sa kalsada patungo sa "exascale computing."

Upang mailagay ito sa pananaw, ang kabuuang kapangyarihan ng compute ng mga sistema ng Top500 na ilang buwan na ang nakararaan ay 274 petaflop / s (isang bagong listahan ng Top500 ay lalabas sa susunod na linggo kasabay ng SuperComputing 14 na palabas). Ang parehong mga sistema ay itatayo ng IBM at ibabatay sa mga CPU ng arkitektura ng IBM Power, Nvidia Tesla GPUs, at mga interconnek ng Mellanox.

Inilarawan ni Tom Rosamilla, Senior Vice President ng IBM Systems & Technology Group, ang mga sistema bilang paggamit ng isang bagong "data centric architecture" na dinisenyo upang maalis ang kilusan ng data hangga't maaari, sa pamamagitan ng paglalagay ng data nang mas malapit sa computing. Sinabi ng IBM na ito ay dinisenyo upang magbigay ng nangungunang gilid, magastos na pagmomolde, kunwa, aplikasyon, at analytics sa Big Data, at sinasamantala ang OpenPower na inisyatiba (kung saan ang mga miyembro ng Nvidia at Mellanox).

Bilang isang bahagi nito, gagamitin nito ang Nvidia Tesla GPU batay sa paparating na arkitektura ng Volta (na nararapat sa 2017, kasunod ng arkitektura ng Pascal dahil sa 2016) at ang teknolohiya ng NVLink ng kumpanya para sa mga koneksyon sa pagitan ng lahat ng mga processors sa isang solong node ng server. Si Sumit Gupta, General Manager ng Tesla GPU Accelerated Computing para sa Nvidia, ay inilarawan ang NVLink bilang ang "unang high-speed interconnect para sa GPU, " pinapayagan ang mga komunikasyon sa point-to-point sa pagitan ng isang GPU at isa pang GPU, pati na rin sa pagitan ng GPU at ng Power CPU. (Ang unang henerasyon ng NVLink ay dahil sa 2016; ang mga bagong sistema ay gagamitin ng pangalawang henerasyon.) Ang mga node sa loob ng mga system ay konektado gamit ang susunod na henerasyon ng Mellanox EDR 100 Gb / s InfiniBand interconnect.

Sinabi ng IBM na ang bawat system ay magkakaroon ng pagganap ng rurok na "mahusay sa higit sa 100 petaflops, " balanseng may higit sa limang petabytes ng pabago-bago at flash memory, at may kakayahang ilipat ang data sa processor nang higit sa 17 petabytes bawat segundo (kung saan sabi ng kumpanya ay katumbas ng paglipat ng higit sa 100 bilyong mga larawan bawat segundo).

Si Jeffrey Nichols, associate director ng laboratoryo para sa Computing at Computational Science ng ORNL, ay inilarawan ang arkitektura bilang "isang mas maliit na bilang ng mga node na may mas malaking ibinahagi na footprint ng memorya" at sinabi na dapat pahintulutan ang mga developer na mag-optimize at mas mahusay na magpatakbo ng mga kahanay na naglo-load na kasalukuyang tumatakbo sa kasalukuyang ORNL's Sistema ng Titan. Sinasabi ng ORNL na ang Summit system nito ay magsasama ng higit sa 3400 node kasama ang bawat node kabilang ang maramihang mga proseso ng IBM Power 9 at maraming mga Nvidia Volta GPU, na may higit sa 512 GB ng DDR4 at mataas na memorya ng bandwidth (sa isang magkakaugnay na disenyo, kaya maaari itong gumana sa lahat ng Ang mga CPU at GPU) kasama ang 800 GB ng hindi nabagong RAM, na naghahatid ng higit sa 40 teraflops ng pagganap ng rurok. Magkakaroon ito ng isang sistema ng Pag-iimbak ng GPFS na may 1TB / s I / O bandwidth at 120 PB ng kapasidad ng disk. Ito ay dapat na palitan ang kasalukuyang sistema ng Titan ng ORNL, na kung saan ay isang sistema ng Cray batay sa mga processors ng AMD Opteron at mga Nvidia Kepler CPU, na may kakayahang 27 petaflop / s, kasama ang mga Nichols na nagsasabing ang Summit ay dapat maghatid ng 5 hanggang 10 beses sa pagganap ng Titan. Ang summit ay nakatakda na maihatid sa 2017 at magagamit para sa mga gumagamit sa 2018.

Ang mga target na aplikasyon para sa sistema ng Summit ay kinabibilangan ng agham ng pagkasunog (sinusubukan upang madagdagan ang kahusayan ng mga engine ng pagkasunog sa pamamagitan ng 25-50 porsyento), agham ng pagbabago ng klima, imbakan ng enerhiya, at lakas ng nuklear. Sinabi ng Nichols na ang Summit ay dapat payagan ang ORNL na "palawakin ang mga abot-tanaw" ng agham na ginagawa nila sa mga lab.

Ang sistemang LLNL, na tinawag na Sierra, ay naka-target sa programang National Nuclear Security Administration (NNSA) Advanced Simulation and Computing (ASC), na kadalasang dinisenyo sa agham at pagtatasa ng sandata. Ayon kay Mike McCoy, ASC Program Director ng LLNL, pinapayagan ng supercomputer ang laboratoryo na gumawa ng mga simulation sa nukleyar na stockpile ng bansa nang hindi na kailangang bumalik sa pagsubok sa nuklear. Sinabi niya na ang code ng simulation ng 3D na armas ng lab ay "isa sa mga pinaka-kumplikadong mga aplikasyon sa planeta." Nabanggit niya na hindi ito isang kaso ng pagbili ng gobyerno ng isang off-the-shelf system ngunit sa halip ay isang "co-design" kung saan nagtutulungan ang mga programmer at system designer sa arkitektura.

Parehong mga system, na bahagi ng isang programa ng Kagawaran ng Enerhiya na kilala bilang Kolaborasyon ng Oak Ridge, Argonne, at Lawrence Livermore pambansang lab (CORAL), ay naglalayong mapabilis ang pagbuo ng high-performance computing. Sinabi ng IBM na ang pagprograma para sa mga nasabing sistema ay maaaring magsimula ngayon, ngunit ang mga system ay hindi mai-install hanggang sa 2017 o 2018. Bilang bahagi ng programa ng CORAL, ang Argonne National Lab ay makakakuha rin ng mga bagong supercomputing ngunit hindi pa ito inihayag.

Sa pangkalahatan, sinabi ni Nichols na tiningnan niya ang Summit at Sierra bilang "maagang mga hakbang patungo sa exascale" at sinabi na inaasahan niya ang mga hinaharap na sistema kasama ang parehong landas ng arkitektura at umaasa sa isang mahabang pakikipagtulungan sa mga nagtitinda. Mga limang taon pagkatapos maihatid ang Summit, aniya, aasa siya na magkaroon ng isang napakalaking computer.

Gayundin, ngayon inihayag ng AMD na nakatanggap ito ng $ 32 milyon sa dalawang mga parangal ng DOE, bilang bahagi ng proyekto ng FastForward2, upang magsaliksik ng arkitektura ng node na node batay sa Heterogeneous System Architecture (HSA) -bilis na pinabilis na pagproseso ng mga yunit (APU) at upang makatulong na magdisenyo ng bago pamantayan para sa mga interface ng memorya sa hinaharap. Sinabi ng DOE na AMD, Cray, IBM, Intel, at Nvidia ang mangunguna sa mga proyekto ng FastForward2. (Ang Intel at Cray ay hindi kasali sa mga supercomputers na inihayag ngayon ngunit patuloy na maging malaking manlalaro sa espasyo, kaya magiging kawili-wiling makita kung nasasangkot sila sa mga plano ni Argonne.)

Nakakuha kami ng dalawang napakalaking bagong supercomputers