Loading [Contrib]/a11y/accessibility-menu.js

Infrastruktúrák

Laboratórium

  • A labor megtervezése az intézetben lévő érdekelt csoportok igényeit szem előtt tartva, közös egyeztetések utján történt. Az egyeztetésekből kiderült hogy a csoportok fő szempontjai a labor eszközeit illetően az egyes node-ok közötti sávszélesség maximalizálása, késleltetése, valamint az egyes GPU-kra eső videomemória mérete volt.

    Megvizsgálva a piacon lévő aktuális termékeket, egy nagy teljesítményű kapu gép, 3 kisebb teljesítményű gépből álló fejlesztői, valamint 4 erősebb gépből álló klaszter felállítását tartottuk a legjobb megoldásnak.

    A harmadik Intel Phi gyorsítókkal szerelt gép, valamint az Infiniband összeköttetés beszerelése a szerver szobai munkálatok végeztével kerül beüzemelésre.

  • Mivel a labor használatának nincs anyagi vonzata, ezért a labor fennmaradása egyedül a rajta végzett számolások során készült cikkek számának a függvénye. Ezért nyomatékosan kérjük a felhasználókat, hogy a cikkek köszönetnyílvánítás részében megemlítsék az "MTA Wigner FK - GPU-Labor" segítségét.

  • Jelenleg az intézeten belüli hálózatról valamennyi gépre direkt módon lehet belépni ssh kapcsolaton keresztül. Az intézeten kívülről csak a kapugép érhető el.

    FONTOS: a kapugép biztonsági okokból csak a 2222-es porton érhető el (a szabvány 22-es helyett)! Aki véletlenül más porton próbálkozik, annak negyed órát várakoznia kell.

    Ajánlott munkafolyamat:

    1. Belépés a kapugépre és/vagy valamelyik fejlesztői gépre.
    2. Programkód fejlesztése/telepítése a közös home könyvtár alatt.
    3. Program lefordítása (nagy program esetén a kapugép erősen ajánlott).
    4. Tesztelés.
    5. Stabil programfutás esetén belépni bármely klasztergépre.
    6. Program futtatása.

Hasznos parancsok

Bármely gépen ellenőrizhető, hogy mely felhasználók futtatnak aktuálisan a 'top' parancs segítségével.

Az aktuális GPU terhelésékről és hőmérsékletekről a driverek adhatnak felvilágosítást. NVIDIA gépeken az 'nvidia-smi' parancs segítségével, míg az ATi/AMD gépeken az 'aticonfig --adapter=ALL' parancs segítségével, amennyiben további kapcsolóként megadjuk vagy az '--odgc' (OverDrive Get Clock) avagy az '--odgt' (OverDrive Get Temperature) kapcsolókat rendre a terhelés és a hőmérsékletek lekérdezésére. Az 'aticonfig' parancs csak akkor használható, ha kiadjuk az 'export DISPLAY=:0' parancsot, így olyan shellben amiből X-ablakokat is szeretnénk továbbítani nem használható.

Ha interaktívan vagyunk kíváncsiak a fentebbi információkra, akkor egy shell "lekötése" árán folyamatosan figyelhetjük a terhelés és hőmérséklet alakulását, amennyiben megszendvicseljük a 'watch' parannccsal. Pl: watch -n 0,5 'aticonfig --adapter=ALL --odgc'.

Eszközök

HPC klaszter

A labor gépeinek beüzemelése megtörtént 4db nagy teljesítményű 2U-s rack egységgel, nagy sebességű hálózati csatolóval összekötve. A gépek specifikációja:

Cluster 1-4 Single Precision [GFLOPS] Double Precision [GFLOPS] Tot SP [GFLOPS] Tot DP [GFLOPS]
Alaplap: ASUS ESC4000FDR/G2
Processzor: 2 × Intel® Xeon® E5-2650 371 371 2,968.0 2,968.0
RAM: 4 × 8GB Kingston DDR3 1600MHz ECC 8 GB sum: 128
GPU: 4 × Nvidia GeForce GTX 1080 Ti 10,609 332 169,744 5,312

Cluster 5 Single Precision [GFLOPS] Double Precision [GFLOPS] Tot SP [GFLOPS] Tot DP [GFLOPS]
Alaplap: ESC8000 G4
Processzor: 2 × Intel® Xeon® E5-2650 460.8 460.8 921.6 921.6
RAM: 12 × 16GB Micron DDR4 2666MHz ECC 16 GB sum: 192 GB
GPU: 6 × AMD Radeon RX Vega 64 8,286 518 49,716 3,108

Cluster 6 Single Precision [GFLOPS] Double Precision [GFLOPS] Tot SP [GFLOPS] Tot DP [GFLOPS]
Alaplap: ESC8000 G4
Processzor: 2 × Intel® Xeon® E5-2650 460.8 460.8 921.6 921.6
RAM: 12 × 16GB Micron DDR4 2666MHz ECC 16 GB sum: 192 GB
GPU: 6 × NVIDIA Tesla T4 8,141 254 65,128 2,035

Cluster 7 Single Precision [GFLOPS] Double Precision [GFLOPS] Tot SP [GFLOPS] Tot DP [GFLOPS]
Alaplap: 4124GS-TNR
Processzor: 2 × AMD EPYC™ 768 768 1536 1536
RAM: 16 × 16GB Micron 3200MHz DDR4 ECC RDIMM 16 GB sum: 256 GB
GPU: 8 × NVIDIA® A2 4531 70.8 36,248 566

Ampere 1 Single Precision [GFLOPS] Double Precision [GFLOPS] Tot SP [GFLOPS] Tot DP [GFLOPS]
Alaplap: Supermicro A+ Server 4124GO-NART+
Processzor: 2 × AMD EPYC 7742P 2,513 2,513 5,026 5,026
RAM: 32 × 64GB Samsung 3200MHz DDR4 ECC Reg DIMM 64 GB sum: 2048 GB
GPU: 2 × Nvidia A100 SMX4 HBM2e 80GB 19,490 9,746 155,920 77,968

Phi 1-4 Single Precision [GFLOPS] Double Precision [GFLOPS] Tot SP [GFLOPS] Tot DP [GFLOPS]
Alaplap: Intel Xeon Server Compute Module
Processzor: Intel® Xeon® 7250 3046 3046 12184 12184
RAM: 6 × 8GB Kingston DDR3 1600MHz ECC
Genagrid10 1 Single Precision [GFLOPS] Double Precision [GFLOPS] Tot SP [GFLOPS] Tot DP [GFLOPS]
Alaplap: SGI Altix UV 100
Processzor: 12 × Intel® Xeon® Processor X7542 52 52 625 625
RAM: 96 × 8GB Hynix DDR3 1066 MHz ECC

FPGA-val felszerelt szerverek

Qsim server 1 1x Single Precision [GFLOPS] Double Precision [GFLOPS] Tot SP [GFLOPS] Tot DP [GFLOPS]
Alaplap: GIGABYTE MZ92-FS0-00
Processzor: 2 × AMD EPYC 7543 1433.6 1433.6 2,867.2 2,867.2
RAM: 16 × Micron 3200MHz DDR4 ECC RDIMM sum: 256
FPGA: 2 × Maxeler FPGA (Xilinx Alveo U250) 2,035 2,035 4,071 4,071

Qsim-workstation 1x Single Precision [GFLOPS] Double Precision [GFLOPS] Tot SP [GFLOPS] Tot DP [GFLOPS]
Alaplap: Supermicro M12SWA-TF
Processzor: AMD Ryzen Threadripper PRO 3955WX 998.4 998.4 998.4 998.4
RAM: 4 × 16GB SK Hynix 3200MHz DDR4 ECC RDIMM sum: 64
FPGA: Maxeler FPGA (Xilinx Alveo U250) 2,035 2,035 2,035 2,035

Mathematica szerver

Ez a gép a Wolfram Mathematica szimulációk számára lett dedikálva, amelyhez kiszhasználható GPU alapú gyorsítás.

Mathematica 1 Single Precision [GFLOPS] Double Precision [GFLOPS] Tot SP [GFLOPS] Tot DP [GFLOPS]
Alaplap: ASUS ESC4000 G4S
Processzor: AMD EPYC 7502P 1,585.0 1,585.0 1,585.0 1,585.0
RAM: 8 × 32GB Kingston 3200MHz DDR4 ECC Reg CL22 DIMM 32 GB sum: 256 GB
GPU:
2 × Nvidia GeForce GTX 980 Graphics 5,612 144 9,224 288
2 × Nvidia GeForce GTX 1080 Ti 11,340 354 22,680 709

Számítási Kapacitások

Teljes SP [GFLOPS] Teljes DP [GFLOPS]
CPU 28 368.6 28 368.6
GPU 525 476 90 664


Teljes memória CPU magok száma Szálak száma
3056 480 1432

Kapu gép

A labor gépei egyedül az intézeten belülről érhetőek el direkt módon. Az intézeten kívülről csak a kapugépen keresztül érhető el a többi gép. A kapu gép számos feladatot lát el (például ennek a weblapnak a kiszolgálását), legfontosabb funkciói azonban a nagy volumenű programok gyors fordítása, a közös home könyvtár biztosítása, valamint a nagyobb, klaszter-párhuzamos számolások "mester" node-jaként funkcionálni. Ugyan a kapu gép is rendelkezik AMD-s GPU kártyákkal, a számolások gyorsítása a fő profilja.

Opteron 1x Double Precision [GFLOPS] Single Precision [GFLOPS] Tot SP [GFLOPS] Tot DP [GFLOPS]
Alaplap: ASUS RS924A-E6/RS8
Processzor: 4 × AMD Opteron™ 6376 166.4 166.4 665.6 665.6
RAM: 4 × 32GB 1333MHz DDR3L ECC Reg CL9 DIMM
GPU: 2 × AMD Radeon R9 270X Graphics 2560 160 5120 320

EPYC 1x Single Precision [GFLOPS] Double Precision [GFLOPS] Tot SP [GFLOPS] Tot DP [GFLOPS]
Alaplap: Supermicro 1014S-WTRT
Processzor: AMD EPYC™ 7262 406.9 406.9 406.9 406.9
RAM: 8 × 16GB Micron 3200MHz DDR4 ECC RDIMM 16 GB sum: 64

Szoftver

Vezérelvek

A labor gépein egységes operációs rendszer telepítések, fordítók és könyvtárak találhatók, így egységesen binárisan kompatibilisek. Minden gépen megtalálhatók a fejlesztéshez szükséges fordítók, a bennük található GPU-nak megfelelő SDK-k, valamint szintén a GPU-kkal kompatiblis FFT és lineáris algebra könyvtárak, amik nagyban megkönnyítik akár a GPGPU programozásban járatlan felhasználók számára is, hogy kiaknázhassák a GPU-kban rejlő lehetőségeket, amennyiben a könyvtárak tartalmazzák az általuk használni kívánt eljárásokat. Az FFT és BLAS könyvtárak aktuális képességei a megfelelő dokumentációkból derül ki. Hozzáértő programozókat is bíztatunk arra, hogy használják ezeket a könyvtárakat, mivel ezek naprakész optimalizációkkal rendelkeznek a gyártó valamennyi architektúrájára.

Amennyiben bármilyen szoftvert tekintve hiány merülne fel, úgy a rendszergazdák igyekeznek azt pótolni lehetőségeikhez mérten. Operációs rendszert váltani nem áll szándékunkban.

Verziók

OS/Program/Könyvtár Verzió
Ubuntu Server 64-bit 18.04 LTS
NVIDIA Display Driver 390.77
AMD APP SDK 3.0
AMD APP ML (clAmdFFT & clAmdBLAS) 1.10
CUDA Toolkit (cuFFT & cuBLAS) 9.1
GCC 7.3.0
Clang 7.0
OpenMPI 1.6
Thrust 1.6
VirtualGL 2.3.3