Performance for High Performance Computing (HPC) Platforms1 2 3

Performance for High Performance Computing (HPC) Platforms<sup>1</sup> <sup>2</sup> <sup>3</sup>

Performance for High Performance Computing (HPC) Platforms1 2 3

The latest Intel platform delivers the capability and agility to reduce the need for dedicated systems running specialized hardware and software for unique workloads. In addition, the 2nd Gen Intel® Xeon® Scalable processor offers outstanding performance across the board: Compute, floating point, deep learning, memory bandwidth, platform technologies, density, and real-world application ...performance.

Intel® Xeon® Scalable Processors

Workload-optimized to support high-demand applications and drive actionable insight.

Learn more

Maximize Processor Performance and Memory Bandwidth

The Intel® Server System S9200WK product family is a purpose built, performance-optimized data center block ideal for use in high performance computing (HPC) and AI applications.

Learn more

Breakthrough Performance for Your Real-World Challenges

From AI and analytics to simulation and modeling, Intel’s high performance computing (HPC) platform integrates powerful memory, storage, fabric, and acceleration to tackle your biggest challenges.

Learn more

Podobne filmy

Informacje o produktach i wydajności

1

30-krotny wzrost przepustowości wnioskowania w przypadku procesora Intel® Xeon® Platinum 9282 z technologią Intel® Deep Learning Boost (Intel DL Boost): testy przeprowadzone przez firmę Intel 26 lutego 2019 roku. Platforma: Dragon Rock, 2-gniazdowy procesor Intel® Xeon® Platinum 9282 (56 rdzeni na gniazdo), HT WŁ., technologia Turbo WŁ., pamięć całkowita: 768 GB (24 gniazda / 32 GB / 2933 MHz), system BIOS: SE5C620.86B.0D.01.0241.112020180249, Centos* 7, jądro 3.10.0-957.5.1.el7.x86_64, Deep Learning Framework: optymalizacja Intel® dla architektury Caffe*, wersja: https://github.com/intel/caffe d554cbf1, ICC 2019.2.187, wersja MKL DNN: v0.17 (commit hash: 830a10059a018cd2634d94195140cf2d8790a75a), model: https://github.com/intel/caffe/blob/master/models/intel_optimized_models/int8/resnet50_int8_full_conv.prototxt, BS=64, brak warstwy danych syntheticData: 3 × 224 × 224, 56 instancji / 2 gniazda, typ danych: INT8 w porównaniu do testów firmy Intel z 11 lipca 2017 r.: 2-gniazdowy procesor Intel® Xeon® Platinum 8180, 2,50 GHz (28 rdzeni), HT wył., technologia Turbo wył., mechanizm zarządzania skalowaniem ustawiony na „performance” w sterowniku intel_pstate, 384 GB pamięci RAM DDR4-2666 z funkcją ECC. CentOS* Linux, wersja 7.3.1611 (Core), jądro systemu Linux 3.10.0-514.10.2.el7.x86_64. Dysk SSD: Intel® SSD z serii DC S3700 (800 GB, 2,5 cala SATA 6 Gb/s, 25 nm, MLC). Wydajność zmierzono przy ustawieniach: Zmienne środowiskowe: KMP_AFFINITY='granularity=fine, compact‘, OMP_NUM_THREADS=56, CPU Freq set with cpupower frequency-set -d 2.5G -u 3.8G -g performance. Caffe: (http://github.com/intel/caffe/), revision f96b759f71b2281835f690af267158b82b150b5c. Wyciąganie wniosków zmierzono poleceniem „caffe time --forward_only”, szkolenie zmierzono poleceniem „caffe time”. W przypadku topologii „ConvNet” użyto syntetycznego zbioru danych. W przypadku pozostałych topologii dane przechowywano w lokalnej pamięci masowej i buforowano w pamięci operacyjnej przed szkoleniem. Dane techniczne topologii: https://github.com/intel/caffe/tree/master/models/intel_optimized_models (ResNet-50). Kompilator Intel® C++, wer. 17.0.2 20170213, małe biblioteki Intel® Math Kernel Library (Intel® MKL), wersja 2018.0.20170425. Caffe uruchomiono z parametrem „numactl -l”.

2

Czterokrotnie wyższa wydajność w testach Linpack w przypadku procesora Intel® Xeon® Platinum 9242 drugiej generacji w porównaniu z procesorem AMD* EPYC* 7601 ze skalowaniem (4-węzłowym, 8-węzłowym).

Procesor Intel® Xeon® 9242: 
platforma referencyjna firmy Intel z procesorami Intel® Xeon® 9242 2S (2,2 GHz, 48 rdzeni), 16 × 16 GB pamięci DDR4-2933, 1 dysk SSD, system plików klastra: 2.12.0-1 (serwer) 2.11.0-14.1 (klient), BIOS: PLYXCRB1.86B.0572.D02.1901180818, mikrokod: 0x4000017, CentOS* 7.6, jądro: 3.10.0-957.5.1.el7.x86_64, stos OFED: OFED OPA 10.8 na RH7.5 z Lustre v2.10.4, adapter magistrali hosta: architektura Intel® Omni-Path Architecture (Intel® OPA), jednoportowy adapter PCIe* × 16, 100 Gb/s, przełącznik: (Intel® OPA) Edge Switch z serii 100, 48 portów, HPL 2.1, kompilator Intel 2019u1, biblioteka Intel® Math Kernel Library (Intel® MKL) 2019, Intel MPI 2019u1, HT = wł., Turbo = wył., 2 wątki na rdzeń, 4-węzłowy = 20 408,00, 8-węzłowy = 39921 GF/s, im wyższa wartość, tym lepiej, test firmy Intel 03.03.2019 r.

AMD EPYC 7601
: Supermicro AS -1023US-TR4, AMD EPYC 7601 (2,2 GHz, 32 rdzenie) 2S, 16 × 16 GB pamięci DDR4-2666, 1 dysk SSD, wersja systemu BIOS: 1.1b (20.08.2018), mikrokod: 0x8001227, Oracle* Linux Server, wer. 7.5 (3.10.0-862.14.4.el7.crt1.x86_64), system plików klastra: Panasas (pamięć masowa 124 TB) wersja oprogramowania sprzętowego 5.5.0.b-1067797.15 EDR based IEEL Lustre, Mellanox EDR MT27700, 100Gb/s, 36-portowy przełącznik Mellanox EDR IB Switch, OFED MLNX mlnx-4.3-3.0.2.0, HPL 2.2, kompilator Intel 2018u3, AMD BLIS v0.4.0, Intel MPI 2018u3, SMT = wł., Turbo = wł., 2 wątki na rdzeń, 4-węzłowy = 4739,96, 8-węzłowy = 9406,07 GF/s, im wyższa wartość, tym lepiej, test firmy Intel 23.09.2018 r.

3

Oprogramowanie i obciążenia wykorzystane w testach wydajności mogły zostać zoptymalizowane pod kątem wydajnego działania tylko na mikroprocesorach Intel®. Testy wydajności, takie jak SYSmark* i MobileMark*, mierzą wydajność określonych systemów komputerowych, komponentów, oprogramowania, operacji i funkcji. Jakakolwiek zmiana wyżej wymienionych czynników może spowodować uzyskanie innych wyników. Aby wszechstronnie ocenić planowany zakup, w tym wydajność danego produktu w porównaniu z konkurencyjnymi, należy zapoznać się z informacjami z innych źródeł oraz innymi testami wydajności. Więcej informacji można znaleźć na stronie www.intel.pl/benchmarks.

Wyniki są oparte na testach z dni wskazanych w szczegółach konfiguracji i mogą nie uwzględniać wszystkich publicznie dostępnych aktualizacji zabezpieczeń. Więcej informacji zawiera zastrzeżenie dotyczące konfiguracji. Żaden produkt ani komponent nie jest w stanie zapewnić całkowitego bezpieczeństwa. Cechy i zalety technologii Intel® zależą od konfiguracji systemu i mogą wymagać obsługującego je sprzętu, oprogramowania lub aktywacji usług. Wydajność może różnić się od podanej w zależności od konfiguracji systemu. Więcej informacji można uzyskać od sprzedawcy lub producenta systemu bądź na stronie intel.pl.