Dom Naprijed razmišljanje Velike promjene napokon su na horizontu za superračunala

Velike promjene napokon su na horizontu za superračunala

2024

Video: Шон Ачор: Как счастье может помочь нам работать лучше? (Studeni 2024)

Osvrnuvši se na ovosedmičnu ISC 17 konferenciju superračunala, čini se da će svijet superračunala vidjeti nekoliko velikih nadogradnji u narednih nekoliko godina, ali ažuriranje dva puta godišnje liste najboljih 500 najbržih superračunala na svijetu nije se puno razlikovalo od prethodna verzija.

Najbrža računala na svijetu i dalje su dvije ogromne kineske mašine koje su na vrhu liste već nekoliko godina: Sunway TaihuLight računalo iz kineskog Nacionalnog centra za računarstvo u Wuxiu, s kontinuiranim Linpack učinkom od više od 93 petaflopsa (93 tisuće bilijuna bilijuna plutajuće točke operacije u sekundi); i računalo Tianhe-2 iz kineskog nacionalnog superračunarskog centra u Guangzhouu, s trajnim performansama od više od 33, 8 petaflopa. Ove su ogromne marže najbrži strojevi.

Novi broj tri je Piz Daint sustav iz švicarskog Nacionalnog centra za superračunalu, Cray sustav koji koristi Intel Xeons i Nvidia Tesla P100s, koji je nedavno nadograđen kako bi dobio Linpack-ove performanse od 19, 6 petaflopa, što je dvostruko više od prethodnog ukupno. To ju je pomaknulo s broja osam na popisu.

Time se najviši američki sustav - sustav Titan u Nacionalnoj laboratoriji Oak Ridge - spušta na četvrto mjesto, čime je ovo prvi put nakon dvadeset godina da nema američkog sustava u top tri. Ostatak popisa ostaje nepromijenjen, s tim da SAD i dalje čine pet od 10 najboljih, a Japan dva.

Čak i ako se popis najbržih računala nije mnogo promijenio, na drugim mjestima postoje velike promjene. Na Zelenoj listi 500 najučinkovitijih sustava promijenilo se devet od prvih deset. Na vrhu je Tsubame 3.0 sustav, modificirani HPE ICE XA sustav u Tokijskom tehnološkom institutu temeljen na Xeon E5-2680v4 14 jezgri, Omni-Path međusobnom povezivanju i Nvidijinoj Tesli P100, koji omogućava 14, 1 gigaflops po vatu. Ovo je veliki skok Nvidijinog DGX-a Saturn V, temeljen na platformi tvrtke DGX-1 i čipovima P100, koji je bio broj jedan na novembarskom popisu, ali deset na ovom mjestu, sa 9, 5 gigaflops / Watt. P100 je u devet najboljih deset Green500 sustava.

Razbijanje 10 gigaflops / vata velika je stvar jer znači da bi hipotetički sustav egzaflopa izgrađen današnjom tehnologijom potrošio ispod 100 megavata (MW). To je još uvijek previše - cilj je 20-30 MW za sustav egzaflopa, za koji se istraživači nadaju da će ga vidjeti u narednih pet godina - ali to je ogroman korak naprijed.

Kao i Top 500, postojale su samo manje izmjene na sličnim popisima s različitim referentnim vrijednostima, poput referentne vrijednosti visokih performansi konjugacijskih gradijenata (HPCG), gdje strojevi imaju tendenciju da vide samo 1-10 posto svojih teorijskih vrhunskih performansi i gdje je vrh sustav - u ovom slučaju stroj Riken K - i dalje isporučuje manje od 1 petaflopa. I TaihuLight i Piz Daint sustavi pomakli su se na ovom popisu. Kada istraživači govore o stroju sa eksoflopom, oni teže znače referentnu vrijednost Linpack, ali HPCG je možda realističniji u pogledu performansi u stvarnom svijetu.

Pojava GPU računarstva kao akceleratora - gotovo uvijek koristeći Nvidia GPU procesore poput P100 - bila je najočitija promjena na tim popisima posljednjih godina, nakon čega je uslijedila Intelov akcelerator, višejezgreni Xeon Phi (uključujući najnovija verzija Knights Landinga). Trenutačni popis Top 500 uključuje 91 sustav koji koristi akceleratore ili koprocesore, uključujući 74 s Nvidia GPU-om i 17 s Xeon Phi-om (s još tri koriste oba); jedan s AMD Radeon GPU-om kao akceleratorom, a dva koji koriste višejezgreni procesor iz japanskog dobavljača PEZY Computing. Dodatnih 13 sustava sada koristi Xeon Phi (Knights Landing) kao glavnu procesnu jedinicu.

No, mnoge od većih promjena superračunala i dalje su na horizontu, jer na umu počinjemo vidjeti veće sustave dizajnirane s tim konceptima. Jedan od primjera je novi MareNostrum 4 u Barcelonskom superračunarskom centru, koji je ušao u Top 500 listu na broju 13. Kao do sada instaliran, ovo je Lenovo sustav zasnovan na nadolazećoj Skylake-SP verziji Xeona (službeno Xeon Platinum 8160 24 -core procesor). Ono što je ovdje zanimljivo jesu tri nova klastera "nove tehnologije" planirana u sljedećih nekoliko godina, uključujući jedan klaster s IBM Power 9 procesorima i Nvidia GPU-ovima, dizajniran tako da ima mogućnost vršne obrade od preko 1, 5 Petaflops; druga koja se temelji na verziji Xeon Phi-a Knights Hill; i treći zasnovan na 64-bitnim ARMv8 procesorima koje je dizajnirao Fujitsu.

Ovi se koncepti koriste u brojnim drugim velikim superračunalnim projektima, posebno u nekoliko sponzoriranih od strane Ministarstva energetike SAD-a u sklopu suradnje CORAL-a u Oak Ridgeu, Argonneu i Nacionalnom laboratoriju Lawrence Livermore. Prvo bi trebao biti Summit na Oak Ridgeu, koji će koristiti procesore IBM Power 9 i GPU-ove Nvidia Volta, a planirani će isporučiti više od 150 do 300 vršnih petaflopa; a slijedi Sijera u Lawrenceu Livermoreu, predviđena za isporuku preko 100 vršnih petaflopa.

Tada bismo trebali vidjeti superračunalo Aurora u Nacionalnom laboratoriju Argonne, temeljeno na verziji Xeon Phi-a Knights Hill, koju je izgradio Cray, a predviđeno je da postigne 180 vršnih petaflopa. Sustavi CORAL trebali bi biti podignuti i trčanje slijedeće godine.

U međuvremenu, kineske i japanske skupine planirale su i nadogradnju, uglavnom koristeći jedinstvene arhitekture. Trebalo bi biti zanimljivo gledati.

Čini se da je još veći pomak tek malo udaljeniji: pomak prema strojnom učenju, obično na masovno paralelnim procesnim jedinicama unutar samog procesora. Dok se Linpack broj odnosi na performanse od 64-bitne ili dvostruke preciznosti, postoje klase aplikacija - uključujući mnoge aplikacije temeljene na dubokoj neuronskoj mreži - koje djeluju bolje s proračunima s jednom ili čak polovinom preciznosti. To iskorištavaju novi procesori, poput nedavne Nvidijine najave Volta V100 i nadolazeće verzije Xeon Phi-ja Knights Mill. Intel je na izložbi rekao da će verzija, koja bi se trebala naći u proizvodnji u četvrtom tromjesečju, imati nove skupove uputa za "računanje male preciznosti" pod nazivom Quad Fused Multiply Add (QFMA) i Quad Virtual Neural Network Instruction (QVNNI), Pretpostavljam da bi se ovi koncepti mogli primijeniti i na druge arhitekture, kao što su Googleovi TPU-ovi ili Intelovi FPGA-i i Nervana čipovi.

Čak i ako ove godine ne vidimo velikih promjena, sljedeće bismo godine trebali očekivati da ćemo ih vidjeti još više. Koncept stroja za izuzeće (1000 teraflopa) još uvijek nije na vidiku, mada će vjerojatno uključivati brojne još veće promjene.