Föld szimulátor - Earth Simulator

Earth Simulator (ES), eredeti verzió
Earth Simulator összekapcsolási rack
Earth Simulator feldolgozó állvány
Earth Simulator számtani feldolgozó modul
Earth Simulator 2 (ES2)
Earth Simulator 3 (ES3)

A Föld -szimulátor ( ES ) (地球 シ ミ ュ レ ー タ, Chikyū Shimyurēta ) , amelyet a japán kormány „Earth Simulator Project” kezdeményezése fejlesztett ki, egy rendkívül párhuzamos vektoros szuperszámítógép -rendszer volt a globális éghajlati modellek futtatásához, hogy felmérjék a globális felmelegedés hatásait és a problémákat a szilárd földön geofizika. A rendszert a Japan Aerospace Exploration Agency , a Japan Atomic Energy Research Institute és a Japan Marine Science and Technology Center (JAMSTEC) számára fejlesztették ki 1997 -ben. Az építkezés 1999 októberében kezdődött, és a telephely hivatalosan 2002. március 11 -én nyílt meg. A projekt 60 milliárdba került jen .

A NEC által épített ES az SX-6 architektúrájukon alapult . Ez állt 640 csomópontok nyolc vektorral processzorok és 16 gigabájt a számítógép memóriájában minden egyes csomóponton, összesen 5120 processzorok és 10 terabájt memória. Két csomópont került beépítésre 1 méter × 1,4 méter × 2 méteres szekrényenként. Minden szekrény 20 kW energiát fogyasztott. A rendszer volt 700 terabájt a lemezes adattároló (450 a rendszer, és 250 a felhasználók) és 1,6 petabájt a háttértároló a szalagos meghajtók . Képes volt a globális éghajlat holisztikus szimulációit futtatni mind a légkörben, mind az óceánokban, 10 km -es felbontásig. A teljesítménye a LINPACK benchmarkon 35,86 TFLOPS volt , ami majdnem ötször gyorsabb volt, mint a korábbi leggyorsabb szuperszámítógép, az ASCI White . 2020 -tól összehasonlítható teljesítmény érhető el 4 Nvidia A100 GPU használatával, mindegyik 9.746 FP64 TFlop -al.

ES volt a leggyorsabb szuperszámítógép a világon 2002 és 2004 között A kapacitás meghaladta IBM „s Blue Gene / L prototípus 2004. szeptember 29.

Az ES-t 2009 márciusában az Earth Simulator 2 (ES2) váltotta fel. Az ES2 egy NEC SX-9/E rendszer, és negyed annyi csomóponttal rendelkezik, amelyek mindegyike 12,8-szorosa a teljesítménynek (3,2 × órajel, négyszerese a feldolgozási erőforrásnak) csomópontonként), a csúcsteljesítmény 131 TFLOPS. A szállított LINPACK 122,4 TFLOPS teljesítményével az ES2 ekkor a világ leghatékonyabb szuperszámítógépe volt. 2010 novemberében a NEC bejelentette, hogy az ES2 11.876 TFLOPS teljesítményszámmal vezeti a HPC Challenge Awards egyik mérőszámának számító Global FFT -t.

Az ES2-t 2015 márciusában az Earth Simulator 3 (ES3) váltotta fel. Az ES3 egy NEC SX-ACE rendszer 5120 csomóponttal és 1,3 PFLOPS teljesítménnyel.

Az ES3 2017 -től 2018 -ig Gyoukou mellett futott , egy merülőhűtéses szuperszámítógép, amely akár 19 PFLOPS -ot is képes elérni.

Rendszer áttekintő

Hardver

A Föld szimulátort (röviden ES) nemzeti projektként három kormányzati ügynökség fejlesztette ki : a Japán Nemzeti Űrfejlesztési Ügynökség (NASDA), a Japán Atomenergia Kutatóintézet (JAERI) és a Japán Tengerészeti Tudományos és Technológiai Központ (JAMSTEC) ). Az ES az Earth Simulator épületben található (kb. 50 m × 65 m × 17 m). Az Earth Simulator 2 (ES2) a NEC SX-9E 160 csomópontját használja. Az Earth Simulator frissítése 2015 márciusában fejeződött be. Az Earth Simulator 3 (ES3) rendszer 5120 NEC SX-ACE csomópontot használ.

Rendszerbeállítások

Az ES egy rendkívül párhuzamos vektoros szuperszámítógépes rendszer, elosztott memória típusú, és 160 processzorcsomópontból állt, amelyeket Fat-Tree Network kötött össze. Minden processzor csomópont egy megosztott memóriával rendelkező rendszer, amely 8 vektor típusú számtani processzorból és egy 128 GB-os fő memóriarendszerből áll. Az egyes aritmetikai processzorok csúcsteljesítménye 102,4 Gflop. Az ES egésze tehát 1280 aritmetikai processzorból áll, 20 TB alapmemóriával és 131Tflop elméleti teljesítménnyel.

CPU felépítése

Minden CPU egy négyirányú szuper-skaláris egységből (SU), vektor egységből (VU) és a fő memóriahozzáférés-vezérlő egységből áll egyetlen LSI chipen. A CPU 3,2 GHz órajel -frekvencián működik. Mindegyik JE 72 vektorregisztert tartalmaz, amelyek mindegyike 256 vektor elemet tartalmaz, valamint 8 készletet hat különböző típusú vektor csővezetékből: összeadás /eltolás, szorzás, osztás, logikai műveletek, maszkolás és betöltés /tárolás. Az azonos típusú vektorcsővezetékek egyetlen vektor utasítással működnek együtt, és a különböző típusú csővezetékek párhuzamosan működhetnek.

Processzor csomópont (PN)

A processzorcsomópont 8 CPU -ból és 10 memóriamodulból áll.

Összekötő hálózat (IN)

Az RCU közvetlenül csatlakozik a keresztléc-kapcsolókhoz, és 64 GB/s kétirányú átviteli sebességgel vezérli a csomópontok közötti adatátvitelt az adatok küldésére és fogadására egyaránt. Így a csomópontok közötti hálózat teljes sávszélessége körülbelül 10 TB/s.

Processzor csomópont (PN) szekrény

A processzor csomópont két csomópontból áll egy szekrényből, és tápegység 8 memóriamodulból és 8 CPU modulból álló PCI dobozból áll.

Szoftver

Az alábbiakban az operációs rendszerben, a feladatütemezésben és az ES2 programozási környezetében használt szoftvertechnológiák leírása található.

Operációs rendszer

Az ES-en futó operációs rendszer, az „Earth Simulator Operating System”, a NEC SUPER-UX egyéni változata, amelyet az ES-t alkotó NEC SX szuperszámítógépekhez használnak .

Tömeges tároló fájlrendszer

Ha egy nagy, 640 PN -n futó párhuzamos munka olvas egy PN -be telepített lemezről/ír rá, akkor minden PN sorban hozzáfér a lemezhez, és a teljesítmény rettenetesen romlik. Bár a helyi I/O, amelyben minden PN saját lemezéről olvas vagy ír, megoldja a problémát, nagyon nehéz feladat ilyen sok részfájl kezelése. Ezt követően az ES elfogadja a nagy sebességű I/O teljesítményt nyújtó Staging and Global File System (GFS) rendszert.

Munkaütemezés

Az ES alapvetően kötegelt feladatrendszer. A Network Queuing System II (NQSII) rendszer bevezetésre került a kötegelt feladat kezeléséhez. Az Earth Simulator sor konfigurációja. Az ES kétféle várólistával rendelkezik. Az S köteg várólista egycsomópontos kötegelt feladatokhoz, az L kötegelt sor pedig többcsomópontos kötegelt sorhoz készült. Kettőtípusú sorok vannak. Az egyik az L köteg sor, a másik az S köteg sor. Az S köteg várólista célja, hogy előfutásra vagy utófutásra használhatók legyenek nagyméretű kötegelt feladatokhoz (kezdeti adatok készítése, szimuláció eredményeinek feldolgozása és egyéb folyamatok), az L kötegelt sor pedig gyártási futtatáshoz. A felhasználók kiválasztják a munkájukhoz megfelelő sort.

  1. A kötegelt feladathoz rendelt csomópontok kizárólag az adott kötegelt feladathoz használhatók.
  2. A kötegelt feladat a CPU idő helyett az eltelt idő alapján van ütemezve.

Az (1) stratégia lehetővé teszi a feladat befejezési idejének becslését, és megkönnyíti a csomópontok előzetes kiosztását a következő kötegelt feladatokhoz. A stratégia (2) hozzájárul a hatékony munkához. A feladat kizárólag a csomópontokat használhatja, és az egyes csomópontokban lévő folyamatok egyszerre hajthatók végre. Ennek eredményeként a nagyszabású párhuzamos program hatékonyan végrehajtható. Az L-rendszer PN-jeinek tilos hozzáférniük a felhasználói lemezhez, hogy biztosítsák a lemez megfelelő I/O teljesítményét. ezért a kötegelt feladat által használt fájlokat a feladat végrehajtása előtt a felhasználói lemezről a munkalemezre másolja. Ezt a folyamatot nevezik "bevezetésnek". Fontos, hogy elrejtse ezt az átmeneti időt a munkaütemezéshez. A munkaütemezés fő lépéseit az alábbiakban foglaljuk össze;

  1. Csomópont -kiosztás
  2. Beépítés (automatikusan másolja a fájlokat a felhasználói lemezről a munkalemezre)
  3. Feladat -eszkaláció (ha lehetséges, a korábbi becsült kezdési időre történő átütemezés)
  4. Munka végrehajtása
  5. Stage-out (automatikusan átmásolja a fájlokat a munkalemezről a felhasználói lemezre)

Új kötegelt feladat beküldésekor az ütemező megkeresi az elérhető csomópontokat (1. lépés). Miután a csomópontokat és a becsült kezdési időt hozzárendelték a kötegelt feladathoz, megkezdődik a beavatkozási folyamat (2. lépés). A munka a beavatkozási folyamat befejezése után megvárja a becsült kezdési időt. Ha az ütemező a becsült kezdési időpontnál korábbi kezdési időt találja, akkor az új kezdési időt a kötegelt feladathoz rendeli hozzá. Ezt a folyamatot "Job Escalation" -nak (3. lépés) hívják. A becsült kezdési idő elérésekor az ütemező végrehajtja a kötegelt feladatot (4. lépés). Az ütemező leállítja a kötegelt feladatot, és megkezdi a kilépési folyamatot, miután a feladat végrehajtása befejeződött, vagy a deklarált eltelt idő véget ért (5. lépés). A kötegelt feladat végrehajtásához a felhasználó bejelentkezik a bejelentkezési kiszolgálóra, és elküldi a kötegelt szkriptet az ES-nek. És a felhasználó megvárja, amíg a feladat végrehajtása megtörténik. Ez idő alatt a felhasználó láthatja a kötegelt feladat állapotát a hagyományos webböngésző vagy felhasználói parancsok használatával. A csomópontok ütemezését, a fájlok átállítását és egyéb feldolgozását a rendszer automatikusan feldolgozza a kötegelt szkriptnek megfelelően.

Programozási környezet

Programozási modell az ES -ben

Az ES hardver háromszintű párhuzamossági hierarchiával rendelkezik: vektorfeldolgozás AP-ben, párhuzamos feldolgozás megosztott memóriával PN-ben és párhuzamos feldolgozás PN-k között IN-n keresztül. Az ES magas teljesítményének teljes kihozásához párhuzamos programokat kell kifejlesztenie, amelyek a legtöbbet használják ki az ilyen párhuzamosságból. az ES párhuzamosságának háromszintű hierarchiája kétféle módon használható, amelyeket hibrid, illetve lapos párhuzamosításnak nevezünk. A hibrid párhuzamosságban a csomópontok közötti párhuzamosságot a HPF vagy az MPI fejezi ki, a csomóponton belüli pedig a mikrotasking vagy az OpenMP, és ezért figyelembe kell vennie a hierarchikus párhuzamosságot a programok írása során. A lapos párhuzamosításban mind a csomópontok közötti, mind a csomóponton belüli párhuzamosság kifejezhető HPF-vel vagy MPI-vel, és nem szükséges figyelembe venni az ilyen bonyolult párhuzamosságot. Általánosságban elmondható, hogy a hibrid párhuzamosság teljesítményben felülmúlja a lapos, és fordítva a könnyű programozást. Ne feledje, hogy az MPI könyvtárak és a HPF futási idők úgy vannak optimalizálva, hogy a lehető legjobban teljesítsenek mind a hibrid, mind a lapos párhuzamosítás során.

Nyelvek

Fortran 90, C és C ++ fordítók állnak rendelkezésre. Mindegyikük fejlett automatikus vektorizálási és mikrotasking funkcióval rendelkezik. A mikrotaszkolás egyfajta multitasking, amelyet a Cray szuperszámítógépéhez biztosítanak egyszerre, és az ES csomóponton belüli párhuzamosítására is használják. A mikrotasking irányítható a direktívák forrásprogramokba való beszúrásával vagy a fordító automatikus párhuzamosításával. (Ne feledje, hogy az OpenMP a Fortran 90 és a C ++ változatban is elérhető a csomóponton belüli párhuzamosításhoz.)

Párhuzamosítás

Üzenetátadó felület (MPI)

Az MPI az MPI-1 és MPI-2 szabványokon alapuló üzenettovábbító könyvtár, amely nagy sebességű kommunikációs képességet biztosít, amely teljes mértékben kihasználja az IXS és a megosztott memória funkcióit. Használható csomóponton belüli és csomópontok közötti párhuzamosításra is. Az MPI folyamat hozzá van rendelve egy AP -hez a lapos párhuzamosításban, vagy egy olyan PN -hez, amely mikroszkópokat vagy OpenMP szálakat tartalmaz a hibrid párhuzamosításban. Az MPI könyvtárakat gondosan úgy tervezték és optimalizálták, hogy mindkét párhuzamosítási módon a lehető legjobb kommunikációs teljesítményt érjék el az ES architektúrán.

Nagy teljesítményű Fortrans (HPF)

Az ES fő használói természettudósok, akik nem feltétlenül ismerik a párhuzamos programozást, vagy inkább nem kedvelik azt. Ennek megfelelően egy magasabb szintű párhuzamos nyelvre nagy a kereslet. A HPF/SX egyszerű és hatékony párhuzamos programozást biztosít az ES -en, hogy kielégítse a keresletet. Támogatja a HPF2.0 specifikációit, a jóváhagyott bővítményeit, a HPF/JA -t és néhány egyedi ES bővítményt

Eszközök

-Integrált fejlesztői környezet (PSUITE)

Az integrált fejlesztői környezet (PSUITE) a SUPER-UX által működtetett program fejlesztésének különféle eszközeinek integrálása. Mivel a PSUITE feltételezi, hogy a GUI különféle eszközöket használhat, és az eszközök között koordinált funkciója van, a program hatékonyabban és egyszerűbben fejleszthető, mint a program múltbeli fejlesztési módszere.

-Hibakeresési támogatás

A SUPER-UX-ben az alábbiak erős hibakeresési támogató funkcióként készülnek a programfejlesztés támogatására.

Felszerelés

Az Earth Simulator épület jellemzői

Védelem a természeti katasztrófákkal szemben

Az Earth Simulator Center számos speciális funkcióval rendelkezik, amelyek segítenek megvédeni a számítógépet a természeti katasztrófáktól vagy eseményektől. Az épület felett drótfészek lóg, amely segít megvédeni a villámokat. Maga a fészek nagyfeszültségű árnyékolt kábeleket használ a villámáram földbe engedésére. Egy speciális fényterjesztő rendszer halogénlámpákat használ, amelyeket az árnyékolt gépterem falain kívül helyeznek el, hogy megakadályozzák a mágneses interferencia elérését a számítógépekhez. Az épület szeizmikus szigetelőrendszerre épül, amely gumitámaszokból áll, amelyek védik az épületet a földrengések során.

Villámvédelmi rendszer

Három alapvető jellemző:

  • A Föld -szimulátor épület mindkét oldalán négy pólus huzalfészket készít, hogy megvédje az épületet a villámcsapástól.
  • Különleges, nagyfeszültségű árnyékolt kábelt használnak az induktív vezetékhez, amely villámáramot bocsát ki a földbe.
  • A talajlemezeket úgy kell lerakni, hogy az épülettől körülbelül 10 méterre tartják.

Megvilágítás

Világítás: Fényterjesztő rendszer egy cső belsejében (255 mm átmérő, 44 m (49 méter) hosszúság, 19 cső) Fényforrás: 1 kW halogén lámpák Világítás: átlagosan 300 lx a padlón A fényforrások az árnyékolt gépterem falaiból kerültek kihelyezésre.

Szeizmikus szigetelő rendszer

11 leválasztó (1 láb magasság, 3,3 láb átmérő, 20 rétegű gumi támogatja az ES épület alját)

Teljesítmény

LINPACK

Az új Earth Simulator rendszer (ES2), amely 2009 márciusában kezdte meg működését, 122,4 TFLOPS teljesítményt és 93,38% -os számítási hatékonyságot (*2) ért el a LINPACK Benchmark (*1) alapján.

  • 1. LINPACK Benchmark

A LINPACK Benchmark a számítógép teljesítményét méri, és standard benchmarkként használják a számítógépes rendszerek rangsorolására a TOP500 projektben. A LINPACK egy olyan program, amely numerikus lineáris algebrát végez számítógépeken.

  • 2. Számítási hatékonyság

A számítási hatékonyság a tartós teljesítmény és a csúcsteljesítmény aránya. Itt ez a 122.4TFLOPS és a 131.072TFLOPS arány.

A WRF számítási teljesítménye a Föld szimulátoron

A WRF (Weather Research and Forecasting Model) egy mezoskálájú meteorológiai szimulációs kód, amelyet az amerikai intézmények, köztük az NCAR (National Center for Atmospheric Research) és az NCEP (National Centers for Environmental Prediction) együttműködésével fejlesztettek ki. A JAMSTEC optimalizálta a WRFV2 -t a 2009 -ben megújított Earth Simulator (ES2) rendszeren a számítási teljesítmény mérésével. Ennek eredményeként sikeresen bebizonyosodott, hogy a WRFV2 kiemelkedő és tartós teljesítménnyel tud futni az ES2 -n.

A numerikus meteorológiai szimulációt a WRF segítségével végezték el a Föld -szimulátoron a Föld féltekéjére, a Nature Run modell feltételével. A modell térbeli felbontása vízszintesen 4486 x 4486, a rácsok távolsága 5 km és függőlegesen 101 szint. Többnyire adiabatikus körülményeket alkalmaztunk 6 másodperces időintegrációs lépéssel. Nagyon nagy teljesítményt ért el az Earth Simulator a nagy felbontású WRF esetében. Míg az Oak Ridge Nemzeti Laboratóriumban a világ leggyorsabb osztályú Jaguar (CRAY XT5) rendszeréhez képest a felhasznált CPU -magok száma csak 1%, a Föld -szimulátoron elért tartós teljesítmény majdnem 50% -a a Jaguar rendszeren mért teljesítménynek. Az Earth Simulator csúcsteljesítménye szintén rekordmagas, 22,2%.

Lásd még

Hivatkozások

Külső linkek

Rekordok
Előzi meg
ASCI Fehér
7,226 teraflops
A világ legerősebb szuperszámítógépe
2002 március - 2004 november
Sikerült a
Blue Gene/L
70,72 teraflopnak

Koordináták : 35 ° 22′51 ″ É 139 ° 37′34,8 ″ K / 35,38083 ° É 139,626333 E / 35.38083; 139.626333