Intel® Xeon Phi™ to centralny procesor rozruchowy do rozwiązań rozbudowanego przetwarzania równoległego i wektorowego stosowanego w najbardziej wymagających zastosowaniach HPC. Zintegrowana i energooszczędna architektura zapewnia znaczny wzrost mocy obliczeniowej w przeliczeniu na jednostkę pobieranej energii względem porównywalnych platform, co daje niższe całkowite koszty utrzymania1. Integracja pamięci i infrastruktury sieciowej ma wpływ na wzrost prędkości pracy pamięci (efekt „memory wall”) przy obniżeniu kosztów, pomaga więc w szybszej realizacji największych wyzwań.

Cechy i zalety

Szybsze podejmowanie wyzwań

Nowe procesory Intel® Xeon Phi™ obsługujące nawet do 72 rdzeni poza kolejnością zapewniają szczytową wydajność przekraczającą 3 teraflopy (liczba operacji zmiennoprzecinkowych na sekundę) w obliczeniach o podwójnej precyzji, co przekłada się na 3,5 krotny wzrost wydajności na jednostkę zużywanej mocy względem poprzedniej generacji.2 3 Rozruchowy procesor Intel® Xeon Phi™ oparty na zintegrowanej architekturze eliminuje wąskie gardła magistrali PCIe*, obejmuje wbudowaną pamięć wysokiej przepustowości oraz dostępną zintegrowaną architekturę Intel® Omni-Path Fabric (Intel® OP Fabric), przyczynia się do wzrostu wydajności i skrócenia opóźnień.

Niespotykane możliwości

Dzięki procesorom Intel® Xeon Phi™ możliwe jest uproszczenie modernizacji kodu i obniżenie kosztów programowania na podstawie udostępnionego kodu i bazy programisty dla jednostek Intel® Xeon®. Standaryzacja obejmująca ujednoliconą architekturę Intel® polega na korzystaniu z jednego modelu programowania dla całego kodu, a tym samym zmniejsza koszty operacyjne i programowania dzięki udostępnionej bazie programisty i wielokrotnemu wykorzystaniu kodu.

Maksymalizacja potencjału

Wspólną cechą procesorów Intel® Xeon Phi™ jest architektura x86 oferująca gigantyczny wzrost wydajności przy każdym obciążeniu. Rozwój architektury Intel® wspierany przez rozbudowany ekosystem partnerów oraz sprawdzone plany rozwojowe gwarantuje skalowalność, większą elastyczność oraz długofalową pomoc techniczną w zakresie komputerów, pamięci operacyjnej/masowej, operacji I/O oraz oprogramowania.

Testy wydajności procesorów Intel® Xeon Phi™


Zobacz kompletne informacje o prędkości, wydajności i konfiguracji.

Elementy rozwiązania Intel® Scalable System Framework (Intel® SSF)

Zwiększ swoje możliwości dzięki odpowiednio zrównoważonej, skalowalnej i elastycznej strukturze systemu zdolnej sprostać obciążeniom roboczym obejmującym duże ilości danych oraz wymagającym dużej mocy obliczeniowej.

Przetwarzanie

Procesory Intel® Xeon® oraz Intel® Xeon Phi™ obsługują najnowocześniejsze technologie, które przyczyniają się do poprawy przepustowości równoległej i ogólnej wydajności, przy jednoczesnym zmniejszeniu zużycia energii.

Rodzina procesorów Intel® Xeon Phi™

Rodzina procesorów Intel® Xeon® E5

Pamięć operacyjna i masowa

Poznaj, w jaki sposób oprogramowanie Intel® for Lustre* może poprawić wydajność i skalowalność równoległego systemu plików Lustre* oraz jak dyski serii Intel® Solid State Drive Data Center Family zapewniają nieograniczone możliwości.

Rozwiązania Intel® dla oprogramowania Lustre*

Intel® Solid-State Drive Data Center Family

Architektura

Technologia Intel® Omni-Path Architecture (Intel® OPA) zapewnia skalowalność i oszczędności, które będą rosnąć z każdą kolejną generacją platform Intel®.

Intel® Omni-Path Architecture (Intel® OPA)

Oprogramowanie

Rozwiązanie Intel® HPC Orchestrator umożliwia szybszy dostęp do przydatnych informacji i podniesienie wydajności dzięki niezawodnemu oprogramowaniu do zarządzania systemami obliczeniowymi dużej skali. Oprogramowanie Intel dla programistów zwiększa dynamicznie wydajność aplikacji.

Intel® HPC Orchestrator

Narzędzia programistyczne Intel® do systemów obliczeniowych dużej skali

Informacje o produktach i wydajności

1

Na podstawie porównania z systemem z 2-gniazdowym E5-2697 v4 z DGEMM. Wynik pomiaru 2070/215 (GFLOP/W) dla Intel® Xeon Phi™ 7250 wobec 1054/290 (GFLOP/W) dla E5-2697 v4. Źródło: pomiar lub szacunki firmy Intel z marca 2016 r. 

Szczegóły konfiguracji:

Parametry konfiguracji — Intel® Xeon® E5-2697 v4:

1-węzeł, dwa procesory Intel® Xeon® E5-2697 v4 na platformie Grantley-EP (Wellsburg) z obsługą 128 GB pamięci całkowitej w systemie Red Hat Enterprise Linux* 7.1 kernel 3.10.0-229 przy użyciu testu stream_omp v5.4, kompilatora Intel 16.0.3.174 i polecenia: icc stream_omp.c -O3 -openmp -o stream_omp -static -freestanding -o stream_omp_v5.4_IC16.0.3.174_80M.

Parametry konfiguracji — Intel® Xeon Phi™:

Platforma użyta do wewnętrznego testu firmy Intel: Intel Adams Pass Product Concept Board (ADP PC), 96 GB DDR4 (6 × 16 GB przy 2133 MHz)

BIOS: CRB BIOS 08.R00.RC085

Ustawienia BIOS:

  • Load Default Settings (Turbo ma wartość On)
  • Ustawić Cluster Mode na wartość Quad
  • Ustawić DDR Memory Speed na wartość 2133 lub Auto
  • MCDRAM Memory Mode przybiera wartość pomiędzy Flat i Cache

Procesory używane w tej wersji:

  • Procesor KNL B0 tQS (Bin3) 7210 QDF# QKTA:  
    • 32 kafelki / 64 rdzenie, 16 GB MCDRAM,
    • 1,5 GHz (jeden rdzeń w trybie turbo), 1,4 GHz (wszystkie rdzenie w trybie turbo), 1,1 GHz (AVX-P1), 1,3 GHz, (non-AVX-P1)
    • 1,6 GHz mesh, 6,4 GT/s OPIO
  • Procesor KNL B0 tQS (Bin2) 7230 QDF# QKTB:  
    • 32 kafelki / 64 rdzenie, 16 GB MCDRAM,
    • 1,5 GHz (jeden rdzeń w trybie turbo), 1,4 GHz (wszystkie rdzenie w trybie turbo), 1,1 GHz (AVX-P1), 1,3 GHz, (non-AVX-P1)
    • 1,7 GHz mesh, 7,2 GT/s OPIO
  • Procesor KNL B0 tQS (Bin1) 7250
    • 34 kafelki / 68 rdzeni, 16 GB MCDRAM,
    • 1,6 GHz (jeden rdzeń w trybie turbo), 1,5 GHz (wszystkie rdzenie w trybie turbo), współczynniki domyślne P
    • 1,7 GHz mesh, 7,2 GT/s OPIO

System operacyjny: RHEL* 7

Opcje Kernel: noreplace-paravirt idle=halt mce=on

Zmienne środowiskowe: Zobacz, jakie obciążenie wybrano dla określonych zmiennych środowiskowych

KNL Self Boot Software Package MPSP 1.2.2

MICPERF 1.3.0 Early Release

ComposerXE 2016 lub równoważny zainstalowany pakiet redystrybucyjny

MKL-based HPL Package 11.3.2.009

Intel MPI wersja 5.1.2-150

Wielkość matrycy:

DGEMM: 20000 × 20000 lub 26000 × 26000

SGEMM: 30000 × 30000

Wielkość zadania LINPACK: 100000

2

Zmierzono na podstawie obliczonej teoretycznie szczytowej wydajności obliczeń zmiennoprzecinkowych o podwójnej precyzji dla jednego koprocesora. 16 kafelków/rdzeń * 61 rdzeni * 1,238 GHz = 1,208 TeraFLOPS. Procesor Intel® Xeon Phi™: 32 kafelki/rdzeń * 68 rdzeni * 1,4 GHz = 3,046 teraFLOPs.

3

Wyniki testów uzyskano przed instalacją najnowszych poprawek oprogramowania i aktualizacji oprogramowania sprzętowego, które służą do likwidacji luk w zabezpieczeniach określanych mianem „Spectre” i „Meltdown”. Po zainstalowaniu tych aktualizacji wyniki te mogą nie mieć zastosowania do posiadanego urządzenia lub systemu.

Oprogramowanie i obciążenia wykorzystane w testach wydajności mogły zostać zoptymalizowane pod kątem wydajnego działania tylko na mikroprocesorach Intel®. Testy wydajności, takie jak SYSmark* i MobileMark*, mierzą wydajność określonych systemów komputerowych, komponentów, oprogramowania, operacji i funkcji. Jakakolwiek zmiana wyżej wymienionych czynników może spowodować uzyskanie innych wyników. Aby wszechstronnie ocenić planowany zakup, w tym wydajność danego produktu w porównaniu z konkurencyjnymi, należy zapoznać się z informacjami z innych źródeł oraz innymi testami wydajności. Więcej informacji można znaleźć na stronie http://www.intel.pl/benchmarks.

Wydajność koprocesora Intel® Xeon Phi™ aktualnie wynosi 1,208 teraflopa przy 300 W (0,004027 TF/W) względem wydajności 3,046 teraflopa przy 215 W (0,014167 TF/W) osiąganej przez procesor Intel® Xeon Phi™ 7250. 0.014167/0.004027 = 3,5.