Tworzenie zoptymalizowanej architektury HPC

Zaprojektuj swój system obliczeniowy dużej skali (HPC) tak, by móc go skalować zgodnie z przyszłymi obciążeniami.

Elementy składowe systemu HPC:

  • Projektowanie własnego systemu HPC może obejmować połączenie strategii obliczeń równoległych, klastrów obliczeniowych oraz przetwarzania sieciowego/rozproszonego.

  • Podejście oparte na chmurze hybrydowej, które obejmuje połączenie lokalnej infrastruktury z zasobami w chmurze publicznej pozwala na skalowanie pionowe dostosowane do indywidualnych potrzeb, zmniejszając ryzyko utraty okazji.

  • Technologie Intel® w zakresie HPC obejmują procesory, pamięć i fabric, tym samym zapewniając podstawę wysokowydajnych, niezwykle skalowalnych systemów.

author-image

By

W obecnym, przyspieszonym środowisku biznesowym podstawą pomyślnego wprowadzenia technologii HPC jest dobrze zdefiniowana architektura HPC. Dostępne są różne projekty systemu HPC i zasoby wspomagające, by ułatwić wzrost wydajności oraz jej skalowalność, w zależności od obciążeń Twojej organizacji i celów w zakresie obliczeń.

Projektowanie systemów HPC

Architektura systemów obliczeniowych dużej skali (architektura HPC) przybiera wiele form, w zależności od Twoich potrzeb. Organizacje mogą wybierać spośród różnych sposobów projektowania systemów HPC.

Obliczenia równoległe
Obliczenia równoległe w HPC umożliwiają klastrom HPC jednoczesne lub równoległe wykonywanie obliczeń. Obliczenia równoległe są kluczowe w rozwiązywaniu dużych, złożonych problemów. Przejmują one znaczne obciążenia i dzielą je na odrębne zadania obliczeniowe wykonywane jednocześnie.

Systemy te można zaprojektować z myślą o skalowaniu pionowym lub poziomym. Obliczenia równoległe w skalowaniu pionowym oznaczają przejmowanie zadań w pojedynczym systemie i dzielenie ich tak, by operacje mogły być wykonywane przez poszczególne rdzenie wykorzystujące możliwie jak najwięcej mocy serwera. Obliczenia równoległe w skalowalniu poziomym oznaczają z kolei przejmowanie tych samych zadań, dzielenie ich na wykonalne części i rozkładanie ich na wiele serwerów lub komputerów, które wykonują wszystkie operacje równolegle.

Klastry obliczeniowe
W klastrach obliczeniowych dużej skali wiele komputerów lub węzłów połączonych jest za pomocą lokalnej sieci (LAN) tak, by stworzyć architekturę klastrów HPC. Funkcjonuje ona jako pojedynczy komputer, który dysponuje najnowocześniejszą mocą obliczeniową. Konfiguracja klastra HPC jest specjalnie zaprojektowana w celu rozwiązania pojedynczego problemu poprzez rozciągnięcie go na wiele węzłów w systemie. Klastry HPC mają określoną topologię sieci i umożliwiają organizacjom wykonywanie zaawansowanych obliczeń bez obniżania prędkości przetwarzania.

Przetwarzanie sieciowe i rozproszone
Przetwarzanie sieciowe w HPC oraz przetwarzanie rozproszone w HPC to tożsame architektury obliczeniowe. Obejmują one wiele komputerów połączonych ze sobą poprzez sieć i mających wspólny cel, na przykład rozwiązanie złożonego problemu lub wykonywanie obszernych zadań obliczeniowych. Podejście to jest idealne do przeprowadzania operacji, które można podzielić na odrębne części następnie rozpowszechniane w sieci. Każdy węzeł w systemie może wykonywać zadania niezależnie, bez konieczności komunikacji z innymi węzłami.

Kompatybilność powszechnych aplikacji HPC
Firma Intel nawiązała współpracę z partnerami branżowymi, by określić najlepsze praktyki w zakresie promowania aplikacji HPC i systemów klastrowych zbudowanych w oparciu o architekturę Intel®. Specyfikacja platformy Intel® HPC obejmuje powszechne wymogi odnośnie oprogramowania i sprzętu, których programiści mogą użyć do budowy podstaw rozwiązań klastrowych. System spełniający te wymogi posiada określony zestaw cech na poziomie aplikacji, w tym komponenty wykonywalne oprogramowania Intel®, które zapewniają najlepsze ścieżki wydajności. Specyfikacja platformy obejmuje informacje odnośnie konfiguracji i zgodności w zakresie szerokiej dziedziny powszechnych aplikacji społecznościowych.

Infrastruktura chmury HPC

W przeszłości systemy HPC ograniczone były do wydajności lokalnej infrastruktury. Obecnie chmura stwarza możliwość rozszeszenia lokalnej wydajności o zasoby w chmurze.

Najnowsze platformy do zarządzania chmurą umożliwiają podejście oparte na chmurze hybrydowej, które łączy lokalną inftrastrukturę z usługami chmury publicznej, by obciążenia mogły być obsługiwane bezproblemowo przez wszystkie dostępne zasoby. Umożliwia to większą elastyczność odnośnie sposobów wdrażania systemów HPC oraz szybkości skalowania, wraz z możliwością optymalizacji całkowitego kosztu posiadania (TCO).

Zazwyczaj lokalny system HPC oznacza niższy TCO niż równorzędny system HPC zarezerwowany 24 godziny na dobę w chmurze. Rozwiązania lokalne zoptymalizowane pod kątem maksymalnej wydajności są jednak w pełni wykorzystywane jedynie w przypadku osiągnięcia maksymalnej wydajności. Przez większość czasu rozwiązanie lokalne nie jest wykorzystywane w pełni, co oznacza bezczynne zasoby. Z drugiej strony, obciążenie, które nie może zostać wykonane ze względu na brak dostępnej wydajności, może skutkować utratą okazji.

Krótko mówiąc, rozszerzanie lokalnej infrastruktury HPC za pomocą chmury w celu obsługi pilnych zadań może ograniczyć ryzyko utraty istotnych okazji. 

Wybór procesorów HPC z myślą o skalowalności i wydajności

Dzięki naszej rozległej wiedzy z zakresu technologii HPC firma Intel spełnia wymogi wydajności do obsługi przyszłych, najbardziej wymagających obciążeń. Skalowalne procesory Intel® Xeon® zapewniają bardzo wszechstronną platformę, którą można bezproblemowo skalować, by spełniała zróżnicowane wymogi wydajności kluczowych obciążeń HPC.

Współpracując z naszymi partnerami firma Intel przyznała priorytet wysiłkom w zakresie opracowywania planów, które służą jako schemat do tworzenia najbardziej zoptymalizowanych projektów systemów HPC. W celu weryfikacji wymogów wydajności Intel® Cluster Checker dba o to, by Twój system klastrowy HPC był nienaruszony i skonfigurowany do obsługi równoległych aplikacji, jednocześnie zapewniając niezwykłą przenośność pomiędzy lokalnymi systemami HPC i systemami w chmurze.

Dzięki technologii Intel® CoFluent™ możesz pszyspieszyć wdrażanie złożonych systemów oraz pomóc określić optymalne ustawienia poprzez modelowanie symulowanych interakcji sprzętu i oprogramowania.

Przełom w zakresie pamięci HPC

Pamięć to integralny komponent projektu systemu HPC. Pamięć może być czynnikiem ograniczającym wydajność Twojej pracy, ponieważ jest ona odpowiedzialna za krótkoterminowe przechowywanie danych w systemie. Technologia Intel® Optane™ pomaga w przezwyciężeniu wąskich gardeł w centrum danych poprzez wypełnianie luk w hierarchii przechowywania danych i pamięci, by móc kontynuować procesy obliczeniowe.

Skalowanie wydajności za pomocą struktur fabric HPC

Aby skutecznie skalować systemy HPC potrzebujesz wysowydajnej struktury fabric, która zaprojektowana jest w celu obsługi klastrów HPC. Architektura Intel® Omni-Path (Intel® OPA) przezwycięża ograniczenia wydajności bieżących technologii fabric poprzez umożliwienie skalowania do rzędu dziesiątek tysięcy węzłów, a nawet więcej. Jest to kompleksowe rozwiązanie dla twórców aplikacji, które obejmuje routing adaptacyjny, routing rozproszony, optymalizację natężenia ruchu, ochronę integralności pakietów oraz potrzeby dynamicznego skalowalnia przepływu danych. Wysokowydajne struktury fabric firmy Intel zaprojektowane są tak, by zaspokoić potrzeby przyszłych obciążeń obliczeniowych HPC, jednocześnie zachowując poziom cenowy obecnie dostępnych technologii fabric.

Prostszy sposób wdrażania HPC

Firma Intel oferuje kluczową wiedzę fachową, by pomóc Ci zrozumieć używane aplikacje oraz sposób, w jaki konkretny system HPC, łączący zasoby lokalne z zasobami w chmurze, pomaga w uzyskaniu pożądanych wyników i maksymalizacji ilości zrealizowanych zadań. Dzięki architekturze HPC opartej na technologiach Intel® będziesz gotowy na własne rozwiązania HPC i  sprostanie przyszłym potrzebom eksaskali.

Obecnie chmura pozwala skalować pionowo systemy HPC poprzez płynne rozszerzenie dostępu do systemów obliczeniowych, pamięci masowej oraz zasobów sieciowych.

Zastrzeżenia i uwagi prawne

Cechy i zalety technologii Intel® zależą od konfiguracji systemu i mogą wymagać obsługującego je sprzętu, oprogramowania lub aktywacji usług. Wydajność może różnić się od podanej w zależności od konfiguracji systemu. Żaden produkt ani komponent nie jest całkowicie bezpieczny. Więcej informacji można uzyskać od sprzedawcy lub producenta systemu bądź na stronie intel.pl.

Opisane scenariusze obniżenia kosztów mają stanowić przykłady na to, jak dany produkt oparty na technologiach Intel® może w określonych warunkach i konfiguracjach wpłynąć na generowanie kosztów oraz zapewnić oszczędności. Warunki mogą ulec zmianie. Firma Intel nie gwarantuje żadnych poziomów kosztów ani ich obniżenia.

Firma Intel nie udziela żadnej wyrażonej wprost ani dorozumianej gwarancji, w tym – bez ograniczeń – dorozumianej gwarancji przydatności handlowej, przydatności do określonego celu i nienaruszenia praw ani żadnej gwarancji wynikającej w trakcie realizacji zadań, przebiegu sprzedaży lub użytkowania w handlu.

Intel, logo Intel oraz inne znaki Intel są znakami towarowymi Intel Corporation lub jej podmiotów zależnych. © Intel Corporation.