Bahay Ipasa ang Pag-iisip Ang mga pangkat ng Supercomputer ay higit sa lahat ay hindi nagbabago, ngunit umupo nang mahigpit

Ang mga pangkat ng Supercomputer ay higit sa lahat ay hindi nagbabago, ngunit umupo nang mahigpit

2024

Video: SuperComputer? - Price, Use and World's Fastest Supercomputer (Nobyembre 2024)

Ang pinakahuling listahan ng mga pinakamabilis na supercomputer sa mundo ay hindi nagbago ng marami, ngunit ang taunang Supercomputing show (SC14) ay nagtampok ng maraming talakayan tungkol sa mga bagong sistema sa listahan, pati na rin ang ilang mga anunsyo ng high-performance computing, tulad ng mga bagong accelerators mula sa Intel at Nvidia.

Ang China's Tianhe-2 supercomputer, na gumagamit ng mga Intel Xeon CPU at Xeon Phi accelerators, ay nanatili sa unang lugar sa listahan ng Top500 na may rurok na pagganap ng 54.9 petaflops (quadrillions ng mga lumulutang na operasyon ng operasyon bawat segundo). Sa taong ito, sa katunayan, ang nangungunang siyam na sistema ay magkapareho sa tuktok na bagong karagdagan sa ika-10 lugar - isang hindi natukoy na makina ng sistema ng pamahalaan ng US na isang Cray CS-Storm na pinalakas ng Intel Xeon E5-2660 v2 CPU at Nvidia K40 GPUs, na konektado sa pamamagitan ng Infiniband.

Dagdag pa sa listahan, mayroong 78 mga bagong sistema, kahit na ito ay isang bagong tala na mababa. At sa pangkalahatan, lumilitaw na nakakakita kami ng isang pagbagal sa rate ng paglago ng pinagsama-samang kapangyarihan ng 500 system.

Ang mga ranggo ng mga sistemang ito ay batay sa benchmark ng LINPACK, bagaman mayroong isang bilang ng mga pagsisikap ngayon sa paligid ng paglikha ng mga bagong benchmark na naglalayong iba't ibang uri ng computing. Nalaman kong kagiliw-giliw na sa isang talumpati sa palabas, si Horst Simon, editor ng listahan ng Top500, ay nagsabi na sa kabila ng layunin na maabot ang isang computer na exascale - 1 mga exaflops bawat segundo (halos 1, 000 petaflops) - 2020, naniniwala siya na malamang na dalhin kami hanggang sa katapusan ng 2024. Sa bahagi na ito ay dahil kakailanganin namin ang mas maraming mga diskarte sa pag-save ng lakas-tulad ng silikon na photonics at pagsasama ng 3D at packaging - upang mapanatili ang lakas na kinakailangan para sa isang exascale system hanggang 20 megawatts. Ito ang mga malalaking sistema.

Sa kabila ng kakulangan ng malaking pagbabago sa tuktok, narinig namin ang ilang bagong mga anunsyo - lalo na ang mga mula sa Intel at Nvidia, na maaaring ituro ang daan patungo sa mas mabilis na mga makina.

Si Nvidia, na ang GPUs at CUDA programming language ay talagang nagsimula ang kilusan patungo sa mga accelerator at coprocessors sa high-performance computing, ay nasa buong palabas na may maraming mga system. Kasalukuyan itong nag-aalok ng K40 accelerator at sa palabas ay inihayag ang susunod na bersyon, ang Tesla K80, na gumagamit ng isang dalawahan-GPU na diskarte upang mag-alok kung ano ang sinabi ng firm ay halos dalawang beses na mas mataas na pagganap at doble ang memorya ng bandwidth ng hinalinhan nito.

Sinabi ni Nvidia na ang K80 ay nag-aalok ng 4, 992 CUDA cores at 24 megabytes ng RAM at mayroong isang peak na kapasidad na 2.91 teraflops bawat board. Ito ay kagiliw-giliw na ang K80 ay magagamit na ngayon at na marami sa mga gumagawa ng system ay nag-aalok na ng mga system sa board. Halimbawa, ipinakita ng Dell ang kanyang bagong mga PowerEdge C4130 server, na hinahayaan kang magkasya hanggang sa apat na Nvidia accelerator board (o mga Intel Xeon Phi accelerator) sa isang 1U server, na may bersyon na K80 na nag-aalok ng hanggang sa 7.2 teraflops sa bawat kahon. Iyon lamang ang isang mabaliw na halaga ng kapangyarihan ng pag-compute sa isang rack (kahit na ang isa ay gumagamit ng maraming enerhiya at kailangan ng maraming paglamig).

Samantala, inihayag ng Intel na ang susunod na bersyon ng Xeon Phi chip nito - isang bersyon na kilala bilang Knight's Landing para sa kung saan ang unang komersyal na sistema ay dapat magsimula sa pagpapadala sa susunod na taon - mayroon na ngayong higit sa 50 mga customer na nagpaplano na gamitin ang bagong bersyon ng processor ng bahagi (kung saan kumilos ang Xeon Phi bilang processor ng system) sa mga bagong supercomputers. Marami pang mga system ang gumagamit ng bersyon ng koprokropers ng carde ng coprocessor ng produkto.

Kabilang sa mga kostumer para sa Knights Landing ay ang superpormador ng Trinity, isang pinagsamang pagsisikap sa pagitan ng Los Alamos at Sandia National Laboratories, at ang Cori supercomputer, na inihayag ng US Department of Energy's (DOE) National Energy Research Scientific Computing (NERSC) Center. Ang Knight's Landing ay dapat na mag-alok ng tungkol sa 3 teraflops ng pagganap, at isasama ang silikon na silikon na photonics na nakabase sa Omni-Path na tela, na sinabi ng kumpanya na mag-aalok ng 100 bilis ng linya ng Gbps at hanggang sa 56 porsiyento na mas mababang switch ng lature ng tela kaysa sa mga alternatibong InfiniBand. (Tandaan na ang mga tagapagbigay ng InfiniBand ay pinag-uusapan ngayon tungkol sa mga bagong bersyon din.)

Sinabi ng Intel na ang follow-up, na kilala bilang Knight's Hill, ay bubuuin gamit ang 10nm process na proseso ng Intel at gamitin ang susunod na henerasyon ng tela ng Omni-Path. Susundan ito ng Landing ng Knight, ngunit hindi na isiwalat ang eksaktong tiyempo.

Hindi maiiwan sa ekwasyon ang AMD, na inihayag at ipinakita ang FirePro S9150 na single-CPU card, na sinasabi nito ay maaaring mag-alok ng 2.53 teraflops ng pagganap. Ang sistemang ito, na na-program gamit ang OpenCL, ay naipadala na.

Sa katunayan, ang isang bagong supercomputer na tinatawag na L-CSC mula sa GSI Helmholtz Center, batay sa S9150 GPUs at Intel Xeon 2690v2 10-core na mga CPU ay nanguna sa bagong bersyon ng listahan ng Green500, na naglilista ng mga supercomputers sa pagkakasunud-sunod ng pagproseso ng kapangyarihan sa bawat watt. Ito ay minarkahan sa unang pagkakataon na ang isang sistema ay nakapagtagumpay ng 5 gigaflops / watt (bilyun-bilyong operasyon sa bawat segundo bawat watt). Tandaan sa listahan na iyon, ang pangalawang sistema ng lugar ay ang Suiren, na pinalakas ng mga PEZY-SC na maraming mga accelerator at Xeon CPU; habang ang natitirang bahagi ng nangungunang 10 ay gumagamit ng Nvidia Tesla GPUs, na nagpapakita ng saklaw ng naturang mga system.

Mayroong iba pa, mas hindi pangkaraniwang mga pagpipilian din. Ipinapakita ng Micron ang chip ng Automata nito, mahalagang isang espesyal na chip ng layunin na idinisenyo para sa pagtutugma ng pattern, para magamit sa mga bagay tulad ng network ng seguridad at paghahanap ng genomics. Ito ay binuo sa isang board ng PCIe 3 na may 32 chips at naisara upang ilunsad sa unang quarter ng 2015, una sa mababang dami. (Ang kumpanya ay nasa likod din ng Hybrid Memory Cube para sa mga susunod na henerasyon na memorya para sa mga nasabing mga system.) Ang IBM ay mayroong TrueNorth processor, na inaasahan nito na tumuturo sa daan sa higit pang "utak na tulad ng utak." Ang NEC ay nagtatrabaho sa susunod na henerasyon ng processor ng SX-ACE vector, na sinasabi nito na mas madaling mag-programa kaysa sa mga GPU. At, siyempre, sinusubukan ng ARM na makapasok sa merkado ng server pati na rin sa X-Gene1 ng Applied Micro na ginagamit bilang isang processor na nagkokonekta sa iba't ibang mga card ng accelerator.

Ang isang bilang ng mga nagtitinda ay nagpapakita ng mga bagong sistema. Bilang karagdagan sa Dell system na nabanggit ko nang mas maaga, ipinakita ni Lenovo ang isang naka-cool na sistema ng dual-processor na batay sa isang pasadyang processor na Intel Xeon E5-2798A (na may 16 na mga cores na tumatakbo hanggang sa 3.2GHz), na sinabi nitong naghahatid ng 1.083 teraflops. At sinabi nito na ang Knights Landing Xeon Phi processor sa susunod na taon ay paganahin ang isang "mapa-kubo" na sistema na naghahatid ng higit sa isang petaflop sa loob lamang ng dalawang standard na 42U racks.

Ang One Stop Servers ay nagpakita ng isang High Density Compute Accelerator, na gumagamit ng PCIe Gen3 upang suportahan ang hanggang sa 16 na high-end accelerator boards mula sa isang solong o maraming mga server, kasama ang kumpanya na nagsasabing nagbibigay ito ng hanggang sa 89.6 teraflops gamit ang Tesla K80 boards. Maaari itong gumana sa PowerM processor ng IBM. Ipinakita ng Huawei ang pagkakaroon ng US ng X6800 Data Center Server nito at isang likido na pinalamig na bersyon ng FusionServer 9000 blade server nito.

Para sa pag-link ng magkasama na mga system, inilunsad ng Obsidian Technologies ang inisyatibo nitong InfiniCortex, na idinisenyo upang kumuha ng isang 100 na koneksyon Gigabit InfiniBand sa mahabang distansya. Inihayag ng kumpanya ang suporta mula sa Ahensya para sa Agham, Teknolohiya, at Pananaliksik (A * STAR) ng Singapore. At ipinakita ni Mellanox ang 100 Gigabit Infiniband na nagtatrabaho higit sa 100 metro sa pamamagitan ng hibla at 8 metro sa pamamagitan ng tanso.

Upang lumikha ng pinakamalaking mga superkompyuter, ang mga organisasyon ay karaniwang bumabalik sa mga kumpanya tulad ng IBM at Cray upang magkasama ang mga system, kahit na madalas itong magtatagal ng maraming taon. Ang pinakamalaking pag-anunsyo ni Cray ng uri sa palabas ay isang $ 80 milyong sistema na kilala bilang Shaheen II sa King Abdullah University of Science and Technology sa Saudi Arabia para sa isang Cray XC40, kasama ang isang Urika-GD na graphic analytics appliance.

At, siyempre, bago ang palabas, iginawad ng DOE ang IBM (at mga vendor ng sangkap na Nvidia at Mellanox) isang malaking kontrata para sa kung ano ang magiging dalawang pinakamalaking supercomputers sa bansa, bawat isa ay may higit sa 100 petaflops.

Tala ng Editor: Na -update ang post na ito noong 11/26. Ang Tianhe-2 ay may rurok na pagganap ng 54.9 petaflops, hindi teraflops.