Telemetria chmury: rozwój Twojej strategii IT

Monitoruj swoje zasoby efektywniej, aby zoptymalizować wydajność i całkowity koszt utrzymania (TCO).

Omówienie telemetrii chmury:

  • Telemetria nawiązuje do monitorowania i analizy informacji o systemach IT w celu śledzenia wydajności i identyfikacji problemów.

  • Najlepsze strategie telemetrii są oparte na całościowym, wielosystemowym podejściu, które umożliwia identyfikację kluczowych wskaźników, istotnych dla firm i operacji IT.

  • Nowe horyzonty telemetrii obejmują sztuczną inteligencję (AI) i analizę predykcyjną, przy pomocy których można wykrywać oraz, w niektórych przypadkach, rozwiązywać problemy bez ingerencji człowieka.

BUILT IN - ARTICLE INTRO SECOND COMPONENT

Czy Twoje systemy IT działają poprawnie? I skąd możesz to wiedzieć? Telemetria dostarcza informacji, aby umożliwić tworzenie nowoczesnych autonomicznych centrów danych, opracowywanie nowych strategii rozwoju i optymalizację doznań użytkowników.

Czym jest telemetria chmury?

Telemetria chmury wykorzystuje narzędzia programowe w celu zapisu i analizy informacji dotyczących infrastruktury IT, które inaczej trudno byłoby zebrać.

Telemetria jest niezwykle istotna, jeśli chodzi o zarządzanie chmurą: dla ludzkiego oka infrastruktura IT wygląda tak samo, niezależnie od tego, czy sprzęt działa optymalnie, czy nie. Telemetria umożliwia specjalistom IT dogłębniejszą obserwację komponentów i monitorowanie aplikacji, dzięki wskaźnikom śledzącym wydajność, wykorzystanie, zużycie energii i nie tylko.

Poprzez skuteczne wykorzystanie telemetrii organizacje mogą poprawić kluczowe wskaźniki wydajności, w tym całkowity koszt utrzymania, niezawodność, bezpieczeństwo, wydajność i pobór mocy. Telemetria jest również w stanie generować informacje pomocne zespołom IT w zarządzaniu zmieniającymi się wymaganiami dotyczącymi przepustowości oraz w odpowiedzi na pytanie, czy dana infrastruktura jest wykorzystywana w sposób efektywny.

Dzięki najnowszym postępom w zakresie telemetrii i orkiestracji chmury organizacje mogą zmierzać w kierunku stworzenia prawdziwie nowoczesnego i autonomicznego centrum danych. AI i analiza predykcyjna w telemetrii chmury mogą przewidywać awarie i inne problemy, a czasami nawet naprawiać je bez ingerencji człowieka.

Optymalizacja infrastruktury za pomocą telemetrii

W ostatnich latach możliwości telemetrii znacznie się rozwinęły. Nowsze wskaźniki i techniki, dostępne dzięki zaawansowanemu sprzętowi, umożliwiają dogłębniejsze monitorowanie i analizę chmury niż w przypadku poprzednich generacji technologii. Zwiększanie wartości i wydajności infrastruktury wymaga przyjęcia całościowego, wielosystemowego podejścia do telemetrii.

serwerów
Ochrona inwestycji w sprzęt wymaga telemetrii serwerowej, która umożliwia dogłębny wgląd w stan serwera. Wskaźniki odnoszące się do poboru mocy i objętościowego przepływu powietrza, jak również do nagrzewania i chłodzenia, mogą pomóc w identyfikacji problemów stanowiących zagrożenie dla stanu sprzętu. Monitorowanie i równoważenie obciążenia serwera, a także śledzenie pamięci serwera, to również ważne kwestie.

Sieć
Przy pomocy skutecznej telemetrii firmy mogą efektywniej zarządzać zasobami obliczeniowymi. Telemetria jest w stanie wykrywać wykorzystanie każdego rdzenia i porównywać wartości procentowe wykorzystania procesora ze specyfikacjami komponentów. Jeśli procesor pracuje nieefektywnie, zespół IT może podjąć się rozwiązania problemu lub zastąpić procesor innym, aby osiągnąć oczekiwane poziomy wydajności.

Pamięć
Telemetria w zakresie klasycznych modułów pamięci typu DIMM (Dual In-line Memory Modules) skupia się na przewidywaniu awarii. Ponieważ problemy związane z konkretnym modułem DIMM często dotyczą całej partii, telemetria może pomóc w ocenieniu, które z pozostałych modułów DIMM należy wymienić, aby zminimalizować ryzyko awarii. Nowoczesne moduły pamięci trwałej (PMM), takie jak pamięć trwała Intel® Optane™, umożliwiają większą wydajność telemetrii. Jest tak, ponieważ moduły pamięci trwałej posiadają analizator wytrzymałości o określonej żywotności, który usprawnia konserwację predykcyjną.

Pamięć masowa
Dyski półprzewodnikowe (SSD) doprowadziły do znacznego zwiększenia możliwości telemetrii. Dyski te, w tym dyski Intel® SSD, wyposażone są w nowoczesne narzędzia do analizy stanu sprzętu, które dostarczają informacje na temat wydajności i pozostałego okresu eksploatacji dysku. Ponieważ stan dysku pogarsza się stopniowo, telemetria umożliwia przewidzenie momentu wystąpienia jego awarii.

Obsługa sieci
W ostatnich latach telemetria w zakresie infrastruktury sieciowej uczyniła postępy. Podczas gdy starsze sterowniki umożliwiały jedynie wgląd w układy we/wy i wydajność sieci, nowsze sterowniki oferują bardziej szczegółowy obraz jej wykorzystania. Dzięki inteligentnym kartom interfejsu sieciowego opartym na układzie Intel® FPGA można precyzyjnie zarządzać równoważeniem obciążenia, aby zmniejszyć obciążenia sieciowe na centralnych zasobach obliczeniowych.

aplikacje
Telemetria w formie monitorowania aplikacji umożliwia dokładniejsze przyjrzenie się aplikacjom w celu stwierdzenia, czy spełniają one określone kryteria. Zespoły IT mogą analizować opóźnienie, przekroczenia limitów czasu, czasy ładowania i inne mierniki ogólnego stanu aplikacji.

Poprzez skuteczne wykorzystanie telemetrii organizacje mogą poprawić kluczowe wskaźniki wydajności, w tym całkowity koszt utrzymania, niezawodność, bezpieczeństwo, wydajność i pobór mocy.

Strategia telemetrii: przydatne wskazówki

Nie istnieje uniwersalna strategia w zakresie telemetrii. Twoja istniejąca infrastruktura, krótko- i długoterminowe rozważania związane z kosztami oraz Twoje cele biznesowe określą ogólny kierunek Twojej strategii.

Jednakże kilka podstawowych zasad znajduje zastosowanie w każdej organizacji, która chce przygotować się na przyszłość przy pomocy nowoczesnej strategii telemetrii:

  • Im mniej, tym lepiej: chociaż telemetria skupia się na gromadzeniu informacji o sprzęcie i oprogramowaniu, nie wszystkie dane są równie ważne. Często gromadzony jest nadmiar informacji, które nie są dostatecznie wykorzystywane. Ważne jest określenie właściwych wskaźników do śledzenia.
  • Krok po kroku: analiza obciążeń roboczych to czteroetapowy proces, rozpoczynający się od przeglądu stanu platformy i sprawdzenia sprzętu. Następnie użyj charakterystyki, aby lepiej zrozumieć zachowanie systemu. Zrównoważ platformę pod kątem konkretnych obciążeń roboczych przy pomocy odpowiedniego dostosowania sprzętu. Gdy sprzęt jest już w porządku, wyprofiluj i zoptymalizuj oprogramowanie, aby zidentyfikować niedoskonałości.
  • Działaj predykcyjnie: nowszy sprzęt i narzędzia umożliwiają dostrzeżenie problemów, zanim one wystąpią. Poprzez przejście na sprzęt, który jest w stanie mierzyć swój własny stan i pozostały okres eksploatacji, umożliwisz zastosowanie predykcyjnej, a nie reaktywnej, strategii konserwacji, która minimalizuje ryzyko awarii i przerw w usługach.
  • Zautomatyzuj podejmowanie decyzji: ponieważ telemetria coraz lepiej identyfikuje problemy, eksploracja danych o infrastrukturze umożliwia podejmowanie lepszych decyzji dotyczących wykorzystania i optymalizacji wydajności. Dzięki wykrywaniu sposobów równoważenia obciążeń roboczych i wykorzystania komponentów w przeszłości eksploracja danych o infrastrukturze umożliwia podejmowanie świadomych decyzji na przyszłość. Wiele z tych decyzji może być nawet podejmowanych automatycznie, po wyszkoleniu modeli AI, w celu optymalizacji wydajności i poboru mocy bez ingerencji człowieka.

Możliwości telemetrii często rosną równolegle z rozwojem infrastruktury, np. gdy nowe rodzaje sprzętu umożliwiają dokonywanie nowych pomiarów. Rozważ każdy nowy komponent dodany do obecnej konfiguracji i jego ewentualny wpływ na Twoją strategię i kluczowe wskaźniki.

Narzędzia firmy Intel do telemetrii chmury

Firma Intel pomaga firmom w zrozumieniu sposobów skutecznego wykorzystania telemetrii i zidentyfikowaniu istotnych wskaźników. Technologia Intel® przyczynia się do usprawnienia nowoczesnej telemetrii chmury, począwszy od telemetrii sprzętowej, po zestawy programistyczne i struktury dla inżynierów wydajności.

Firma Intel wprowadziła telemetrię już nawet do rozwiązań krzemowych za pomocą naszych zaawansowanych jednostek monitorowania wydajności (Intel® PMU). Ten wyrafinowany sprzęt wbudowany na chipie umożliwia większą wydajność telemetrii, w tym zaawansowane wskaźniki i diagnostykę. Bezustannie rozwijamy nasze jednostki PMU równolegle do aktualizacji architektury.

Dzięki kolektorowi danych Intel® Telemetry Collector (ITC) zespoły IT mogą błyskawicznie analizować i przeglądać wizualizacje wydajności szeregu systemów. ITC umożliwia dostęp do tego samego zestawu narzędzi, z którego korzystają inżynierowie wydajności firmy Intel podczas oceny wydajności.

Wraz z rozwojem możliwości telemetrii firma Intel kontynuuje działalność na rzecz innowacji i edukacji w zakresie wszystkich etapów analizy i optymalizacji obciążeń roboczych. Z radością tworzymy technologię przyszłości dla naszych dzisiejszych klientów, począwszy od analizy predykcyjnej i rozszerzonej, po postępy w zakresie telemetrii sprzętowej.

Zastrzeżenia prawne

Technologie Intel® mogą wymagać obsługującego je sprzętu, oprogramowania lub aktywacji usług.

Żaden produkt ani komponent nie jest całkowicie bezpieczny.

Rzeczywiste koszty i wyniki mogą się różnić.

Wszystkie plany i roadmapy dotyczące produktu mogą ulec zmianie bez powiadomienia.