Pamięć masowa DAOS to rewolucja w technologii wydajnej pamięci masowej

Dzięki pamięci trwałej Intel® Optane™ rozproszona asynchroniczna pamięć obiektowa (DAOS) zapewnia znaczny wzrost liczby operacji we/wy pamięci masowej, pozwalając na przyspieszenie projektów związanych z HPC, AI, analizą danych oraz chmurą.

DAOS

  • Zasada działania tradycyjnej pamięci masowej polega na blokowaniu metadanych w blokach we/wy podczas przetwarzania żądań z wielu węzłów obliczeniowych. DAOS przechowuje metadane w bajtach w pamięci trwałej Intel® Optane™ i w ten sposób eliminuje opóźnienia spowodowane blokowaniem bloków we/wy.

  • W połączeniu z dyskami SSD NVMe DAOS może w pełni wykorzystać prędkości bezpośredniego połączenia PCIe do mikrosekundowych operacji we/wy.

  • DAOS przesuwa granice pojemności obliczeniowej HPC w kierunku eksaskali oraz zapewnia lepszą przepustowość w niektórych z najlepszych konfiguracji wymienionych w IO-500.

  • Dzięki taniej pamięci masowej NAND pamięć trwała łagodzi również wpływ intensywnych obciążeń operacjami zapisu na wydajność DAOS.

  • Skalowalne procesory Intel® Xeon® w klastrach pamięci masowej poprawiają wydajność DAOS dzięki większej liczbie kanałów pamięci i przepustowości PCIe.

author-image

Pamięć masowa DAOS to rewolucja w technologii wydajnej pamięci masowej

Dzięki pamięci trwałej Intel® Optane™ rozproszona asynchroniczna pamięć obiektowa (DAOS) zapewnia znaczny wzrost liczby operacji we/wy pamięci masowej, pozwalając na przyspieszenie projektów związanych z HPC, AI, analizą danych oraz chmurą.

Osiągnij wysoką wydajność pamięci masowej dzięki DAOS

DAOS to rozproszone rozwiązanie pamięci masowej z otwartym kodem źródłowym oparte na kilku innowacyjnych zasadach. Dzięki szybkim operacjom we/wy oraz mechanizmowi zapisywania danych pamięci trwałej Intel® Optane™ w połączeniu z dowolnym dyskiem SSD typu Non-Volatile Memory Express (NVMe), takim jak dyski Intel® NVMe SSD, technologia ta gwarantuje złagodzenie wąskich gardeł i zwiększenie wydajności pamięci masowej w środowiskach rozproszonych.

Opóźnienia w tradycyjnych rozwiązaniach pamięci masowej

W tradycyjnych rozwiązaniach pamięci masowej system operacyjny (OS) otrzymuje informacje o lokalizacji danych w klastrze pamięci poprzez odczyt metadanych. Za każdym razem, gdy system uzyskuje dostęp do danych w celu odczytu lub zapisu, musi również stworzyć lub zmodyfikować skorelowane metadane w bloku we/wy na bazowym nośniku pamięci. W klastrach obliczeniowych wiele węzłów może potrzebować dostępu do tego samego bloku, więc tradycyjna pamięć masowa tymczasowo blokuje dany blok, aby zapobiec konfliktom zapisu. Kiedy takie blokowanie ma miejsce w przypadku milionów operacji odczytu/zapisu, proces ten generuje znaczne opóźnienia pamięci masowej, które ograniczają operacje we/wy aplikacji.

Mikrosekundowe opóźnienia zapisu dzięki DAOS, pamięci trwałej Intel® Optane™ i dyskom Intel® NVMe SSD

W konfiguracji DAOS moduły pamięci trwałej Intel® Optane™ przechowują metadane dla całego klastra jako ciąg bajtów, a nie jako blok, więc nie ma konieczności blokowania całego bloku, jak w przypadku tradycyjnej pamięci masowej. Ponadto zastosowanie dysków SSD z interfejsem NVMe umożliwia układowi we/wy pamięci masowej nasycenie magistrali PCIe większym potokiem danych w porównaniu z dyskami SSD z interfejsem SATA.1 W rezultacie DAOS może zapewnić o rzędy wielkości szybsze we/wy pamięci masowej — od milisekund (ms) do dziesiątek mikrosekund (μs) — w porównaniu z tradycyjną pamięcią masową.2 Pamięć trwała zachowuje również metadane podczas wyłączania lub ponownego uruchamiania systemu i może absorbować małe operacje zapisu, aby zapewnić nieprzerwaną pracę i dostępność systemu w przypadku rygorystycznych umów SLA. Przy zastosowaniu DAOS z pamięcią masową 3D QLC NAND pamięć trwała może również pomóc złagodzić wpływ presji zapisu na wydajność klastra pamięci masowej.

Rysunek 1. Stos oprogramowania i sprzętu DAOS.

Oprogramowanie typu open source i zatwierdzone wersje DAOS

Poza warstwą sprzętową, do uzupełnienia stosu dostawcy rozwiązań będą potrzebowali oprogramowania DAOS z otwartym kodem źródłowym. Programiści mogą pobrać kod do kompilacji bezpośrednio z GitHub. Aby uprościć wdrażanie, przetestowane i zweryfikowane wersje binarne są dostępne na stronie społeczności daos.io. Firma Intel aktywnie współpracuje z partnerami i dostawcami rozwiązań, aby zapewnić ofertę produktów DAOS ze wsparciem technicznym na poziomie L3.

Uzyskaj dostęp do najnowszych wersji kodu na GitHub
Pobierz zweryfikowane pliki binarne ze strony daos.io
Sprawdź dokumentację DAOS na daos.io
Dołącz do listy mailingowej DAOS, aby otrzymywać najnowsze aktualizacje społeczności

HPC i big data: pamięć masowa DAOS zmienie przyszłość

W klastrach big data i HPC węzły obliczeniowe są ściśle połączone z warstwami pamięci masowej, a naukowcy zajmujący się danymi zwykle mają do czynienia z różnymi typami zimnych, ciepłych i gorących danych. W przyszłości podstawą konfiguracji pamięci masowych będzie podejście hybrydowe, w ramach którego systemy plików będą korzystały zarówno z pamięci masowej, jak i z zoptymalizowanych pod względem kosztów dysków SATA. Laboratoria akademickie i rządowe już się cieszą korzyściami płynącymi z wysokich mocy obliczeniowych i wydajności klastrów HPC, które przyspieszają proces prowadzenia badań. 

Na przykład centrum badań radiologicznych Uniwersytetu Waszyngtońskiego wdrożyło oparty na DAOS definiowany programowo system pamięci masowej zdolny do przechowywania nawet 13 petabajtów danych przy obniżonym koszcie pamięci masowej wynoszącym 1500 USD na węzeł.3 Komercyjne wdrożenia HPC również wykazują duży potencjał, zwłaszcza w sektorach energetyki i opieki zdrowotnej, gdzie systemy obliczeniowe dużej skali są potrzebne w zarządzaniu obciążeniami AI oraz w analityce i symulacjach. W teście porównawczym IO-500, który jest rankingiem najszybszych systemów pamięci masowej na świecie, połowę z 10 najwyższych pozycji zajmują obecnie rozwiązania z różnymi konfiguracjami DAOS.4

Pamięć masowa DAOS dla systemów o wydajności eksaskalowej

DAOS został wybrany jako system przechowywania plików dla superkomputera laboratorium Argonne National Lab (ANL) o nazwie Aurora, pierwszego powstającego systemu HPC ukierunkowanego na eksaskalową wydajność obliczeniową, z opartą na DAOS pamięcią masową o pojemności nawet 230 petabajtów przy przepustowości odczytu/zapisu > 25 TB/s. ANL i Texas Advanced Computing Center (TACC), kolejny partner firmy Intel korzystający z rozwiązania HPC opartego na DAOS, od września 2020 r. także znajdują się w pierwszej piątce na liście IO-500. Te sukcesy również wzbudziły zainteresowanie ze strony dostawców usług w chmurze, takich jak Google Cloud Platform, którzy chcą teraz zintegrować DAOS ze swoimi usługami przechowywania w chmurze.

Niskie opóźnienia odczytu, nawet w przypadku intensywnych obciążeń operacjami zapisu

DAOS może mieć pozytywny wpływ na wydajność systemu przechowywania danych nawet w przypadku nośników zoptymalizowanych pod względem kosztów i przystosowanych do intensywnych obciążeń operacjami odczytu. Podczas testów z dyskami SSD Intel® QLC 3D NAND zamiast dysków SSD NVMe, konfiguracja z DAOS była w stanie osiągnąć poziom pięciu dziewiątek (P99,999) przy wartości opóźnienia odczytu w przedziale 200-300 μs, co oznacza, że 99,999% wszystkich żądań zostało dostarczonych w czasie poniżej 300 μs.2 Przy intensywnych obciążeniach operacjami zapisu sięgających 2500 MB/s ten sam test pokazał, że DAOS umożliwią osiągnięcie SLA dla operacji odczytu na poziomie pięciu dziewiątek w czasie krótszym niż 5 ms.2

Skalowalne procesory Intel® Xeon® a wydajność pamięci masowej DAOS

Większa wydajność procesora w węźle pamięci masowej pozytywnie wpłynie na wydajność DAOS. Ulepszenia generacyjne w zakresie liczby kanałów pamięci, przepustowości na kanał, a także szybkości PCIe (PCIe 4 w porównaniu do PCIe 3) zapewniają znaczny wzrost wydajności DAOS. W teście porównawczym IOR konfiguracja ze skalowalnymi procesorami Intel® Xeon® trzeciej generacji i pamięcią trwałą Intel® Optane™ z serii 200 osiągnęła 58-procentowy wzrost wydajności zapisu w porównaniu z procesorami i pamięcią trwałą poprzedniej generacji.5 Oczekuje się, że PCIe 5 w przyszłych generacjach procesorów zapewni jeszcze wyższy poziom wydajności DAOS.

Wniosek: DAOS toruje drogę ku większej przepustowości pamięci masowej

DAOS oferuje nową ścieżkę do osiągnięcia doskonałej przepustowości pamięci masowej, która dopasowuje się do tempa rosnącej wydajności obliczeniowej i gwarantuje ustalony poziom przepustowości w najbardziej wymagających przypadkach, a we wszystkich innych nawet zapewnia jej zapas. Sztuczna inteligencja, aplikacje analityczne, systemy obliczeniowe dużej skali, a nawet aplikacje do przetwarzanie w chmurze mogą odnieść korzyści z zastosowania DAOS opartego na pamięci trwałej Intel® Optane™.

Często zadawane pytania

Często zadawane pytania

Rozproszona asynchroniczna obiektowa pamięć masowa (DAOS) to rozproszone rozwiązanie pamięci masowej typu open source. Pamięć trwała Intel® Optane™, na której opiera się DAOS, pozwala na dostępu do i odczyt metadanych, a dyski SSD NVMe zapewniają wysoką prędkość odczytu danych.

Tradycyjna pamięć rozproszona zapisuje metadane w blokach we/wy na bazowym nośniku i blokuje jakiekolwiek zmiany w poszczególnych blokach we/wy za każdym razem, gdy węzeł obliczeniowy wykonuje operację, która tworzy, modyfikuje lub usuwa metadane. W konfiguracji DAOS metadane są przechowywane jako ciąg bajtów w modułach pamięci trwałej Intel® Optane™. Klastry pamięci masowej DAOS stosują nieblokujące operacje we/wy, co powoduje radykalne zmniejszenie latencji we/wy pamięci masowej.

Tak, możesz korzystać z interfejsu POSIX z DAOS. Chociaż w środku DAOS nie jest zgodny z POSIX, zapewniamy interfejs POSIX, jak również HDF5, MPI-IO, Python, klucz-wartość i inne. Przejrzyj dokumentację na stronie daos.io, aby uzyskać więcej informacji na temat słabych stron różnych interfejsów DAOS.

Wydajność różni się w zależności od użytkowania, konfiguracji i innych czynników. Dowiedz się więcej na stronie intel.com/Performanceindex.

Wyniki oparte są na testach z dni wskazanych w konfiguracjach i mogą nie uwzględniać wszystkich publicznie dostępnych aktualizacji. Szczegóły dotyczące konfiguracji można znaleźć w materiałach dodatkowych. Żaden produkt ani komponent nie jest całkowicie bezpieczny.

Informacje o produktach i wydajności

1Konfiguracje: deklaracje wydajności na podstawie specyfikacji, sekwencyjny odczyt/zapis przy rozmiarze bloku 128K dla NVMe i SATA, 64K dla SAS. Seria Intel® SSD DC P3700 2 TB, SAS Ultrastar SSD1600MM, Seria Intel® SSD DC S3700 SATA 6 Gb/s. Procesor Intel® Core™ i7-3770K, 3,50 GHz, 8 GB pamięci systemowej, Windows Server 2012, IOMeter. Wydajność operacji losowych jest mierzona z użyciem czterech procesów roboczych, każdy z kolejką o głębokości 32.
3„Uniwersytet Waszyngtoński: Wdrażanie szybkiej pamięci masowej z technologiami Intel®”, intel.com, październik 2021 r.
4IO500.org według stanu na październik 2021 r.
5Test przeprowadzony przez firmę Intel w dniu 15 października 2020 r. Konfiguracja podstawowa: Platforma: S2600WFO, 1 węzeł z 2 skalowalnymi procesorami Intel® Xeon® Platinum 8260L drugiej generacji, mikrokod 0x400002c, z włączoną technologią Hyper-Threading i trybem turbo, tryb wydajności, system BIOS SE5C620.86B.02.01.0008.031920191559, oprogramowanie sprzętowe pamięci trwałej 01.00.00.5127, konfiguracja pamięci systemowej DRAM 12 gniazd / 16 GB / 2666 MHz (łączna pojemność 192 GB), konfiguracja systemowej pamięci trwałej 12 gniazd / 512 GB / 2666 MHz (łączna pojemność 6 TB), 1 dysk SSD Intel® SATA, 2 karty sieciowe Intel® OPA100, koncentrator kontrolera platformy (PCH) Intel® C621, system operacyjny openSUSE Leap 15.2, jądro 5.3.18-lp152.44-default, obciążenie DAOS 1.1.0. Nowa konfiguracja: Platforma: WLYDCRB1, 1 węzeł z 2 skalowalnymi procesorami Intel® Xeon® ICX-24C trzeciej generacji (przedprodukcyjna wersja Ice Lake), mikrokod 0x8b000260, z włączoną technologią Hyper-Threading i trybem turbo, tryb wydajności, system BIOS WLYDCRB1.SYS.0017.D75.2007020055, oprogramowanie sprzętowe pamięci trwałej 02.01.00.1110, konfiguracja pamięci systemowej DRAM 16 gniazd / 16 GB / 3200 MHz pracuje na 2933 MHz (łączna pojemność 256 GB), konfiguracja systemowej pamięci trwałej 16 gniazd / 512 GB / 2666 MHz (łączna pojemność 8 TB), 1 dysk SSD Intel® SATA, 2 karty sieciowe Intel® OPA100, koncentrator kontrolera platformy (PCH) Intel® C621, system operacyjny openSUSE Leap 15.2, Jądro 5.3.18-lp152.44-default, obciążenie DAOS 1.1.0.