Indeksuj do 2,49 razy więcej dokumentów na sekundę i skróć czas wyszukiwania obciążeń Elasticsearch dzięki maszynom wirtualnym Microsoft Azure Ddsv5 wyposażonym w skalowalne procesory Intel® Xeon® trzeciej generacji

Elasticsearch

  • Indeksuj do 2,49 razy więcej dokumentów na sekundę na maszynach wirtualnych Microsoft Azure Ddsv5 ze skalowalnymi procesorami Intel® Xeon® trzeciej generacji w porównaniu z instancjami Dsv3.

  • Skróć czas wyszukiwania o 69% na maszynach wirtualnych Microsoft Azure Ddsv5 dzięki skalowalnym procesorom Intel® Xeon® trzeciej generacji w porównaniu z instancjami Dsv3.

author-image

Według

Maszyny wirtualne Ddsv5 przyspieszyły indeksowanie zarówno maszyn wirtualnych Dsv3, jak i Ddsv4 z procesorami poprzedniej generacji.

Microsoft Azure Kubernetes Services (AKS) zapewniają elastyczność i zwinność organizacjom korzystającym z obciążeń Elasticsearch w klastrach Kubernetes w chmurze. Który typ maszyny wirtualnej oferuje najlepszy poziom wydajności dla tych obciążeń? Aby się tego dowiedzieć, porównaliśmy wydajność Elasticsearch trzech typów instancji w konteneryzowanym środowisku Kubernetes:

  • Maszyny wirtualne Microsoft Azure Ddsv5 ze skalowalnymi procesorami Intel® Xeon® trzeciej generacji
  • Maszyny wirtualne Microsoft Azure Ddsv4 ze skalowalnymi procesorami Intel® Xeon® drugiej generacji
  • Maszyny wirtualne Microsoft Azure Dsv3 z procesorami Intel Xeon E5-2673 v4

Aby określić ilościowo wydajność Elasticsearch, użyliśmy narzędzia porównawczego Rally 2.3.0, które działa jako generator obciążenia oraz rejestruje i przechowuje metryki telemetryczne w Elasticsearch podczas obciążeń wyszukiwania, znajdując problemy z wydajnością w celu dokonania porównania między klastrami. Korzystając z dwóch zestawów danych z Rally, nyc_taxis (zestaw danych z analizy transportu) i http_logs (zestaw danych z usług sieci Web), odkryliśmy, że maszyny wirtualne Azure Ddsv5 ze skalowalnymi procesorami Intel® Xeon® trzeciej generacji indeksowały do 2,49 razy więcej dokumentów na sekundę oraz miały o 69 procent krótszy czas wyszukiwania w porównaniu z klastrem Azure Dsv3 VM. Ponadto maszyny wirtualne Ddsv5 przewyższały maszyny wirtualne Ddsv4 nawet o 30 procent pod względem przepustowości indeksowania przy czasie wyszukiwania krótszym o 29%. Więcej informacji o Rally i zastosowanych obciążeniach znajdziesz poniżej.

Pokazuje to, że w przypadku wielu obciążeń Elasticsearch wybór maszyn wirtualnych Azure Ddsv5 z najnowszą technologią procesorową może zapewnić lepszą wydajność usług Azure Kubernetes Services niż maszyny wirtualne oparte na dwóch poprzednich generacjach procesorów. Dzięki szybszemu indeksowaniu treści organizacje w krótszym czasie uzyskują potrzebne dane do podejmowania ważnych decyzji biznesowych.

Szybsze indeksowanie danych w celu uzyskania szybszych informacji dzięki maszynom wirtualnym Azure Ddsv5

Chociaż organizacje korzystają z Elasticsearch w wielu przypadkach, w tym do monitorowania wydajności aplikacji, wyszukiwania aplikacji i analizy biznesowej, porównaliśmy przepustowość indeksowania dla obciążenia analizy transportu i typowego obciążenia usług sieci Web (patrz Ilustracja 1).

Korzystając z zestawu danych nyc_taxis, który przechowuje dane dotyczące przejazdów 2015 taksówek w Nowym Jorku i uruchamia scenariusze wyszukiwania, maszyny wirtualne Ddsv4 ze skalowalnymi procesorami Intel® Xeon® drugiej generacji indeksowały o 53 procent więcej dokumentów na sekundę (dokumentów/sek.) niż klaster maszyn wirtualnych Dsv3. Maszyny wirtualne Azure Ddsv5 ze skalowalnymi procesorami Intel® Xeon® trzeciej generacji jeszcze bardziej poprawiły wydajność, oferując 91% więcej dokumentów/sek niż maszyny wirtualne Dsv3.

W zestawie danych http_logs, który używa przykładowych danych dziennika serwera HTTP i uruchamia scenariusze wyszukiwania, typy maszyn wirtualnych ponownie wykazały podobne skalowanie wydajności w przypadku maszyn wirtualnych Dsv3. Maszyny wirtualne Azure Ddsv4 miały o 92% większą przepustowość, podczas gdy maszyny wirtualne Ddsv5 obsługiwane przez skalowalne procesory Intel® Xeon® trzeciej generacji miały 2,49 razy większą przepustowość, co zapewnia znacznie szybsze indeksowanie.

Rysunek 1. Względna przepustowość indeksowania, w dokumentach na sekundę, jaką osiągnęły klastry przy użyciu dwóch typów zestawów danych z testu porównawczego Rally do oceny wydajności Elasticsearch. Wyższe liczby są lepsze.

Ogranicz czas wyszukiwania dzięki maszynom wirtualnym Azure Ddsv5

Test porównawczy Rally uchwycił również opóźnienia wyszukiwania podczas uruchamiania obciążeń Elasticsearch. Krótszy czas wyszukiwania oznacza, że organizacje nie muszą czekać tak długo, aby uzyskać wgląd w swoje dane. Ilustracja 2 porównuje znormalizowane opóźnienia wyszukiwania, których doświadczyły maszyny VM dla obu zestawów danych nyc_taxis i http_logs. Maszyny wirtualne Ddsv4 ze skalowalnymi procesorami Intel® Xeon® drugiej generacji zmniejszyły opóźnienia wyszukiwania odpowiednio o 33 procent i 44 procent. Najnowsze maszyny wirtualne Ddsv5 ze skalowalnymi procesorami Intel® Xeon® trzeciej generacji skróciły czas oczekiwania jeszcze bardziej, zmniejszając opóźnienia wyszukiwania odpowiednio o 56% i 69% w porównaniu z maszynami wirtualnymi Dsv3.

Rysunek 2. Względne opóźnienie wyszukiwania w milisekundach, które osiągnęły klastry, uruchamiając dwa typy zestawów danych z testu porównawczego Rally do oceny wydajności Elasticsearch. Im mniejsza liczba, tym lepiej.

Podsumowanie

Bez względu na konkretny przypadek użycia Elasticsearch, indeksowanie większej ilości treści na sekundę może umożliwić szybszy wgląd. Testy pokazują, że wybranie maszyn wirtualnych Microsoft Azure Ddsv5 wyposażonych w skalowalne procesory Intel® Xeon® trzeciej generacji do uruchomienia Elasticsearch w klastrach Kubernetes może poprawić przepustowość indeksowania i czas wyszukiwania w wielu przypadkach użycia.

Jeśli wybrany typ instancji w chmurze może indeksować więcej danych w krótszym czasie w celu zapewnienia szybszego wglądu w dane, może to również zmniejszyć liczbę instancji, które musisz kupić, potencjalnie poprawiając koszty operacyjne.

Więcej informacji

Aby rozpocząć uruchamianie obciążeń Elasticsearch na maszynach wirtualnych Microsoft Azure Ddsv5, odwiedź stronę https://docs.microsoft.com/en-us/azure/virtual-machines/ddv5-ddsv5-series1.

Aby dowiedzieć się więcej o Elastic, odwiedź stronę https://www.elastic.co/1.

Aby skorzystać z narzędzia porównawczego Rally, odwiedź stronę https://github.com/elastic/rally. Oba zestawy danych wykorzystane w testach można znaleźć pod adresem https://github.com/elastic/rally-tracks/tree/master/http_logs oraz https://github.com/elastic/rally-tracks/tree/master/nyc_taxis.