Szukasz rozwiązań opartych na chmurze?

Korzyści z Intel® HPC

Rozwiązania HPC według branży

Informacje o produktach i wydajności

111 razy wyższa wydajność wnioskowania partii AI ze zoptymalizowaną przez firmę Intel strukturą TensorFlow w porównaniu z konfiguracją stosu Cascade Lake FP32 Nowość: 8380: jeden węzeł, 2x procesor Intel® Xeon® Platinum 8380 na Coyote Pass z 512 GB (16 gniazd/ 32 GB/ 3200) pamięci całkowitej DDR4, ucode X261, HT włączone, Turbo włączone, Ubuntu 20.04 LTS, 5.4.0-65-generic, 1x Intel_​SSDSC2KG96, Intel SSDPE2KX010T8. ResNet-50 v1.5, gcc-9.3.0, oneDNN 1.6.4, BS=128 FP32, INT8, TensorFlow 2.4.1 z optymalizacjami firmy Intel dla skalowalnych procesorów Intel® Xeon® trzeciej generacji, upstreamowany do TensorFlow- 2.5 (kontener- intel/intel-optimized-tensorflow:tf-r2.5-icx-b631821f), Model Zoo: https://github.com/IntelAI/models/tree/icx-launch-public/quickstart/, niezoptymalizowany model: TensorFlow- 2.4.1, Model Zoo: https://github.com/IntelAI/models -b master, test przeprowadzony przez firmę Intel dnia 12.03.2021 r. Standard podstawowy: 8280: jeden węzeł, 2x procesor Intel® Xeon® Platinum 8280 na Wolf Pass z 384 GB (12 gniazd/ 32 GB/ 2933) pamięci całkowitej DDR4, ucode 0x5003003, HT włączone, Turbo włączone, Ubuntu 20.04 LTS, 5.4.0-48-generic, 1x Samsung_​SSD_​860, Intel SSDPE2KX040T8, ResNet-50 v1.5, gcc-9.3.0, oneDNN 1.6.4, BS=128 FP32, INT8, zoptymalizowany model: TensorFlow 2.4.1 z optymalizacjami firmy Intel dla skalowalnych procesorów Intel® Xeon® trzeciej generacji, upstreamowany do TensorFlow- 2.5 (kontener- intel/intel-optimized-tensorflow:tf-r2.5-icx-b631821f), Model Zoo: https://github.com/IntelAI/models/tree/icx-launch-public/quickstart/, niezoptymalizowany model: TensorFlow- 2.4.1, Model Zoo: https://github.com/IntelAI/models -b master, test przeprowadzony przez firmę Intel dnia 17.02.2021 r.
21,53 raza Wyższa wydajność systemów HPC (geomean HPL, HPCG, STREAM Triad, WRF, Binomial Options, Black Scholes, Monte Carlo, OpenFOAM, GROMACS, LAMMPS, NAMD, RELION).
31,70 raza wyższa wydajność aplikacji Monte Carlo w wersji: v1.1, uwagi dotyczące kompilacji: narzędzia: Intel® MKL 2020u4, Intel® C++ Compiler 2020u4, Intel® Threading Building Blocks 2020u4; wątki/rdzenie: 1, Turbo: użyte, manipulatory kompilacji: -O3 -xCORE-AVX512 -qopt-zmm-usage=high -fimf-precision=low -fimf-domain-exclusion=31 -no-prec-div -no-prec-sqrt.
4Od dnia 21 lipca 2021 r. firma Intel oferuje nawet 12 kanałów pamięci DDR4 dla procesorów Intel® Xeon®, w porównaniu do 8 kanałów dla AMD EPYC.
51,60 raza wyższa wydajność w naukach przyrodniczych i materiałowych (geomean GROMACS, LAMMPS, NAMD, RELION).
61,61 raza wyższa wydajność aplikacji RELION Plasmodium Ribosome w wersji: 3_​1_​1; uwagi dotyczące kompilacji: narzędzia: Intel® C++ Compiler 2020u4, Intel® MPI 2019u9; wątki/rdzenie: 2; Turbo: użyte; manipulatory kompilacji: -O3 -ip -g -debug inline-debug-info -xCOMMON-AVX512 -qopt-report=5 –restrict.
71,64 raza wyższa wydajność aplikacji GROMACS (geomean ion_​channel_​pme, lignocellulose_​rf, water_​pme, water_​rf) w wersji: v2020.5_​SP; uwagi dotyczące kompilacji: narzędzia: Intel® MKL 2020u4, Intel® C++ Compiler 2020u4, Intel® MPI 2019u8; wątki/rdzenie: 2; Turbo: użyte; manipulatory kompilacji: -O3 -ip -xCORE-AVX512.
81,60 raza wyższa wydajność aplikacji LAMMPS (geomean Polyethylene, Stillinger-Weber, Tersoff, Water) w wersji: v2020-10-29; uwagi dotyczące kompilacji: narzędzia: Intel® MKL 2020u4, Intel® C++ Compiler 2020u4, Intel® Threading Building Blocks 2020u4, Intel® MPI 2019u8; wątki/rdzenie: 2; Turbo: użyte; manipulatory kompilacji: -O3 -ip -xCORE-AVX512 -qopt-zmm-usage=high.
91,57 raza wyższa wydajność aplikacji NAMD (geomean Apoa1, f1atpase, STMV) w wersji: 2.15-Alpha1 (obejmującej algorytm kafelek AVX); uwagi dotyczące kompilacji: narzędzia: Intel® MKL, Intel® C++ Compiler 2020u4, Intel® MPI 2019u8, Intel® Threading Building Blocks 2020u4; wątki/rdzenie: 2; Turbo: użyte; manipulatory kompilacji: -ip -fp-model fast=2 -no-prec-div -qoverride-limits -qopenmp-simd -O3 -xCORE-AVX512 -qopt-zmm-usage=high.
101,42 raza wyższa wydajność symulacji OpenFOAM Motorbike 42M. Nowość: 6354: 1 węzeł, 2x procesor Intel® Xeon® Gold 6354 (18 rdzeni/3.0 GHz, 205W TDP) na platformie Intel® Software Development Platform z 512 GB (16 gniazd/ 32 GB/ 3200) pamięci całkowitej DDR4, ucode 0x261, HT włączone, Turbo włączone, CentOS Linux 8.3, 4.18.0-240.10.1.el8_​3.x86_​64, 1x Intel_​SSDSC2KG96. Testy firmy Intel przeprowadzone pomiędzy 12 marca 2021 r. a 29 marca 2021 r. Standard podstawowy: 6154: 1 węzeł, 2x procesor Intel® Xeon® Gold 6154 (18 rdzeni/3.0 GHz, 200W TDP) na platformie Intel® Software Development Platform z 192 GB (16 gniazd/ 16 GB/ 3200) pamięci całkowitej DDR4, ucode 0x2006a0a, HT włączone, Turbo włączone, CentOS Linux 8.3, 4.18.0-240.10.1.el8_​3.x86_​64, 1x Intel_​SSDSC2KG96. Testy firmy Intel przeprowadzone pomiędzy 1 lutego 2021 r. a 20 lutego 2021 r.