HPC klaszter
A labor gépeinek beüzemelése megtörtént 4db nagy teljesítményű 2U-s rack egységgel, nagy sebességű hálózati csatolóval összekötve. A gépek specifikációja:
Cluster | 1-4 | Single Precision [GFLOPS] | Double Precision [GFLOPS] | Tot SP [GFLOPS] | Tot DP [GFLOPS] |
---|---|---|---|---|---|
Alaplap: | ASUS ESC4000FDR/G2 | ||||
Processzor: | 2 × Intel® Xeon® E5-2650 | 371 | 371 | 2,968.0 | 2,968.0 |
RAM: | 4 × 8GB Kingston DDR3 1600MHz ECC | 8 GB | sum: | 128 | |
GPU: | 4 × Nvidia GeForce GTX 1080 Ti | 10,609 | 332 | 169,744 | 5,312 |
Cluster | 5 | Single Precision [GFLOPS] | Double Precision [GFLOPS] | Tot SP [GFLOPS] | Tot DP [GFLOPS] |
---|---|---|---|---|---|
Alaplap: | ESC8000 G4 | ||||
Processzor: | 2 × Intel® Xeon® E5-2650 | 460.8 | 460.8 | 921.6 | 921.6 |
RAM: | 12 × 16GB Micron DDR4 2666MHz ECC | 16 GB | sum: | 192 GB | |
GPU: | 6 × AMD Radeon RX Vega 64 | 8,286 | 518 | 49,716 | 3,108 |
Cluster | 6 | Single Precision [GFLOPS] | Double Precision [GFLOPS] | Tot SP [GFLOPS] | Tot DP [GFLOPS] |
---|---|---|---|---|---|
Alaplap: | ESC8000 G4 | ||||
Processzor: | 2 × Intel® Xeon® E5-2650 | 460.8 | 460.8 | 921.6 | 921.6 |
RAM: | 12 × 16GB Micron DDR4 2666MHz ECC | 16 GB | sum: | 192 GB | |
GPU: | 6 × NVIDIA Tesla T4 | 8,141 | 254 | 65,128 | 2,035 |
Cluster | 7 | Single Precision [GFLOPS] | Double Precision [GFLOPS] | Tot SP [GFLOPS] | Tot DP [GFLOPS] |
---|---|---|---|---|---|
Alaplap: | 4124GS-TNR | ||||
Processzor: | 2 × AMD EPYC™ | 768 | 768 | 1536 | 1536 |
RAM: | 16 × 16GB Micron 3200MHz DDR4 ECC RDIMM | 16 GB | sum: | 256 GB | |
GPU: | 8 × NVIDIA® A2 | 4531 | 70.8 | 36,248 | 566 |
Ampere | 1 | Single Precision [GFLOPS] | Double Precision [GFLOPS] | Tot SP [GFLOPS] | Tot DP [GFLOPS] |
---|---|---|---|---|---|
Alaplap: | Supermicro A+ Server 4124GO-NART+ | ||||
Processzor: | 2 × AMD EPYC 7742P | 2,513 | 2,513 | 5,026 | 5,026 |
RAM: | 32 × 64GB Samsung 3200MHz DDR4 ECC Reg DIMM | 64 GB | sum: | 2048 GB | |
GPU: | 2 × Nvidia A100 SMX4 HBM2e 80GB | 19,490 | 9,746 | 155,920 | 77,968 |
Phi | 1-4 | Single Precision [GFLOPS] | Double Precision [GFLOPS] | Tot SP [GFLOPS] | Tot DP [GFLOPS] |
---|---|---|---|---|---|
Alaplap: | Intel Xeon Server Compute Module | ||||
Processzor: | Intel® Xeon® 7250 | 3046 | 3046 | 12184 | 12184 |
RAM: | 6 × 8GB Kingston DDR3 1600MHz ECC |
Genagrid10 | 1 | Single Precision [GFLOPS] | Double Precision [GFLOPS] | Tot SP [GFLOPS] | Tot DP [GFLOPS] |
---|---|---|---|---|---|
Alaplap: | SGI Altix UV 100 | ||||
Processzor: | 12 × Intel® Xeon® Processor X7542 | 52 | 52 | 625 | 625 |
RAM: | 96 × 8GB Hynix DDR3 1066 MHz ECC |
FPGA-val felszerelt szerverek
Qsim server 1 | 1x | Single Precision [GFLOPS] | Double Precision [GFLOPS] | Tot SP [GFLOPS] | Tot DP [GFLOPS] |
---|---|---|---|---|---|
Alaplap: | GIGABYTE MZ92-FS0-00 | ||||
Processzor: | 2 × AMD EPYC 7543 | 1433.6 | 1433.6 | 2,867.2 | 2,867.2 |
RAM: | 16 × Micron 3200MHz DDR4 ECC RDIMM | sum: | 256 | ||
FPGA: | 2 × Maxeler FPGA (Xilinx Alveo U250) | 2,035 | 2,035 | 4,071 | 4,071 |
Qsim-workstation | 1x | Single Precision [GFLOPS] | Double Precision [GFLOPS] | Tot SP [GFLOPS] | Tot DP [GFLOPS] |
---|---|---|---|---|---|
Alaplap: | Supermicro M12SWA-TF | ||||
Processzor: | AMD Ryzen Threadripper PRO 3955WX | 998.4 | 998.4 | 998.4 | 998.4 |
RAM: | 4 × 16GB SK Hynix 3200MHz DDR4 ECC RDIMM | sum: | 64 | ||
FPGA: | Maxeler FPGA (Xilinx Alveo U250) | 2,035 | 2,035 | 2,035 | 2,035 |
Mathematica szerver
Ez a gép a Wolfram Mathematica szimulációk számára lett dedikálva, amelyhez kiszhasználható GPU alapú gyorsítás.
Mathematica | 1 | Single Precision [GFLOPS] | Double Precision [GFLOPS] | Tot SP [GFLOPS] | Tot DP [GFLOPS] |
---|---|---|---|---|---|
Alaplap: | ASUS ESC4000 G4S | ||||
Processzor: | AMD EPYC 7502P | 1,585.0 | 1,585.0 | 1,585.0 | 1,585.0 |
RAM: | 8 × 32GB Kingston 3200MHz DDR4 ECC Reg CL22 DIMM | 32 GB | sum: | 256 GB | |
GPU: | |||||
2 × Nvidia GeForce GTX 980 Graphics | 5,612 | 144 | 9,224 | 288 | |
2 × Nvidia GeForce GTX 1080 Ti | 11,340 | 354 | 22,680 | 709 |
Teljes SP [GFLOPS] | Teljes DP [GFLOPS] | |
---|---|---|
CPU | 28 368.6 | 28 368.6 |
GPU | 525 476 | 90 664 |
Teljes memória | CPU magok száma | Szálak száma |
---|---|---|
3056 | 480 | 1432 |
Kapu gép
A labor gépei egyedül az intézeten belülről érhetőek el direkt módon. Az intézeten kívülről csak a kapugépen keresztül érhető el a többi gép. A kapu gép számos feladatot lát el (például ennek a weblapnak a kiszolgálását), legfontosabb funkciói azonban a nagy volumenű programok gyors fordítása, a közös home könyvtár biztosítása, valamint a nagyobb, klaszter-párhuzamos számolások "mester" node-jaként funkcionálni. Ugyan a kapu gép is rendelkezik AMD-s GPU kártyákkal, a számolások gyorsítása a fő profilja.
Opteron | 1x | Double Precision [GFLOPS] | Single Precision [GFLOPS] | Tot SP [GFLOPS] | Tot DP [GFLOPS] |
---|---|---|---|---|---|
Alaplap: | ASUS RS924A-E6/RS8 | ||||
Processzor: | 4 × AMD Opteron™ 6376 | 166.4 | 166.4 | 665.6 | 665.6 |
RAM: | 4 × 32GB 1333MHz DDR3L ECC Reg CL9 DIMM | ||||
GPU: | 2 × AMD Radeon R9 270X Graphics | 2560 | 160 | 5120 | 320 |
EPYC | 1x | Single Precision [GFLOPS] | Double Precision [GFLOPS] | Tot SP [GFLOPS] | Tot DP [GFLOPS] |
---|---|---|---|---|---|
Alaplap: | Supermicro 1014S-WTRT | ||||
Processzor: | AMD EPYC™ 7262 | 406.9 | 406.9 | 406.9 | 406.9 |
RAM: | 8 × 16GB Micron 3200MHz DDR4 ECC RDIMM | 16 GB | sum: | 64 |
Szoftver
Vezérelvek
A labor gépein egységes operációs rendszer telepítések, fordítók és könyvtárak találhatók, így egységesen binárisan kompatibilisek. Minden gépen megtalálhatók a fejlesztéshez szükséges fordítók, a bennük található GPU-nak megfelelő SDK-k, valamint szintén a GPU-kkal kompatiblis FFT és lineáris algebra könyvtárak, amik nagyban megkönnyítik akár a GPGPU programozásban járatlan felhasználók számára is, hogy kiaknázhassák a GPU-kban rejlő lehetőségeket, amennyiben a könyvtárak tartalmazzák az általuk használni kívánt eljárásokat. Az FFT és BLAS könyvtárak aktuális képességei a megfelelő dokumentációkból derül ki. Hozzáértő programozókat is bíztatunk arra, hogy használják ezeket a könyvtárakat, mivel ezek naprakész optimalizációkkal rendelkeznek a gyártó valamennyi architektúrájára.
Amennyiben bármilyen szoftvert tekintve hiány merülne fel, úgy a rendszergazdák igyekeznek azt pótolni lehetőségeikhez mérten. Operációs rendszert váltani nem áll szándékunkban.
Verziók
OS/Program/Könyvtár | Verzió |
---|---|
Ubuntu Server 64-bit | 18.04 LTS |
NVIDIA Display Driver | 390.77 |
AMD APP SDK | 3.0 |
AMD APP ML (clAmdFFT & clAmdBLAS) | 1.10 |
CUDA Toolkit (cuFFT & cuBLAS) | 9.1 |
GCC | 7.3.0 |
Clang | 7.0 |
OpenMPI | 1.6 |
Thrust | 1.6 |
VirtualGL | 2.3.3 |