Bazy danych w służbie analityki: uwolnienie potencjału informacji

Optymalizuj pamięć masową i dostęp, aby wyciągnąć nowe wnioski z Twoich danych.

Przegląd technologii dotyczących bazy danych:

 • Systemy zarządzania bazą danych (DBMS) dają użytkownikom dostęp do danych i pozwalają na ich przetwarzanie.

 • Istnieją różne rodzaje oprogramowania DBMS i sprawdzają się one w kwestii przechowywania oraz zajmowania się różnorodnymi typami danych. Można je zoptymalizować pod kątem szeregu obciążeń roboczych.

 • Firma Intel® pracuje nad optymalizacją systemów baz danych z mocami obliczeniowymi zaprojektowanymi dla baz danych, w tym procesorami, bezpośrednio programowalnymi macierzami bramek (FPGA) i akceleratorami. Dostarczamy również pamięć masową, pamięć operacyjną i technologie sieciowe, a także biblioteki oprogramowania oraz wsparcie dla opracowywania otwartego oprogramowania, w tym Java i Linux.

author-image

Według

Bazy danych to systemy, które służą do organizacji i przechowywania danych. Stanowią one fundament każdej strategii analitycznej. Właściwa struktura i podstawowa architektura takich systemów mogą decydować o tym, czy będziesz mieć dobrze obsługiwaną oraz wartościową strukturę, czy taką, która może zawalić się pod własnym ciężarem.

Bazy danych zwykle zaczynają odgrywać znaczącą rolę dopiero w drugim etapie potoku danych, czyli przetwarzania danych (etap „przygotowania i przechowywania”). Aplikacje i platformy analityczne wykorzystują zawarte w bazach danych informacje, aby pomóc organizacjom w zrozumieniu przeszłości i przewidywaniu przyszłości.

Organizacje potrzebują baz danych, które są zoptymalizowane pod kątem wykonywania zadań w zasięgu ręki — od banków analizujących transakcje finansowe w celu wykrycia oszustw, po inteligentne firmy rolnicze wykorzystujące wideo do zmniejszenia zużycia pestycydów. Każda organizacja wybierająca oprogramowanie i systemy bazy danych musi zdecydować się na technologię, która skutecznie rozwiąże dany problem.

Natomiast sprawne działanie Twojej bazy danych zależy nie tylko od oprogramowania, ale również od sprzętu. Dzięki właściwej infrastrukturze możesz poprawić wydajność bazy danych i ułatwić zarządzanie nią. Taka infrastruktura obejmuje różne rodzaje mocy obliczeniowych (procesory, bezpośrednio programowalną macierz bramek i akceleratory), pamięć masową, pamięć operacyjną, sieć, biblioteki oprogramowania i optymalizacje Java.

Oprogramowanie DBMS

Oprogramowanie DBMS umożliwia przechowywanie informacji w bazie danych, a także odzyskiwanie ich stamtąd. Obejmuje ono nie tylko interfejs użytkownika pozwalający na interakcję z bazą danych, lecz również optymalizacje, które nadają pierwszeństwo obciążeniom roboczym oraz pomagają przyspieszyć dostęp.

Do popularnych oprogramowań DBMS zaliczamy Oracle, SAP HANA, Microsoft* SQL Server, Splunk oraz Apache Cassandra. Każdy DBMS korzysta z konkretnego rodzaju struktury danych, jak np. drzewka, tablice, stosy i wykresy. Służy to organizowaniu danych i skuteczniejszym zarządzaniu nimi.

Rodzaje baz danych

Analityka przedsiębiorstwa ma na celu wyciągnięcie wartości z wielu rodzajów danych, pochodzących z różnych źródeł. Optymalizacja strategii analitycznej musi zacząć się na poziomie bazy danych oraz od wyboru DBMS, który będzie skuteczny dla Twoich konkretnych potrzeb biznesowych. Znaczne kompromisy należy poczynić w kwestii spójności, dostępności i tolerancji partycji, bowiem żadna technologia dla bazy danych nie jest w stanie zapewnić wszystkich tych funkcji jednocześnie. Koncepcja ta, znana jako twierdzenie CAP, oznacza, że organizacje muszą wybrać, które mocne strony bazy danych są najważniejsze dla ich konkretnych potrzeb biznesowych. 

Bazy danych mogą być hostowane na miejscu lub w chmurze. W tym drugim przypadku zyskujemy skalowalność, lecz niektóre przedsiębiorstwa wolą przechowywać dane na miejscu. Powód? Większa kontrola nad bezpieczeństwem, szczególnie w regulowanych branżach.

Twój język programowania definiuje struktury danych i jest kluczowy w kwestii ich przetwarzania oraz analizy. Różne produkty i rodzaje bazy danych korzystają z języków zoptymalizowanych pod kątem konkretnych rodzajów danych, funkcji i przypadków użycia. Wiele dużych firm będzie potrzebowało różnych rodzajów baz danych, aby skutecznie organizować i wykorzystywać swoje dane.

Relacyjne bazy danych

Relacyjne bazy danych, oparte za ujednoliconych tabelach danych wyrażających relacje pomiędzy danymi, korzystają zwykle ze strukturalnego języka zapytań (SQL). Relacyjne bazy danych bardzo dobrze sprawdzają się w zarządzaniu danych zbudowanych przy pomocy spójnych reguł i relacji, jak np. transakcje finansowe lub śledzenie produktów. Oprogramowanie dla relacyjnych baz danych obejmuje Oracle, Microsoft* SQL Server, IBM DB2 oraz Azure SQL.

 • OLTP
  OLTP (Online Transactional Processing) to kategoria przetwarzania danych, która skupia się na zadaniach zorientowanych na transakcje. Zwykle obejmuje wprowadzanie, aktualizowanie i/lub usuwanie małych ilości danych w bazie danych.
  Jednym z najpowszechniejszych zastosowań dla baz danych jest przetwarzanie transakcji. OLTP jest trybem dostępu do baz danych, który jest ukierunkowany na przetwarzanie transakcji przez wielu użytkowników równocześnie. Jest to powszechny sposób na używanie baz danych Oracle, IBM i Microsoft*.
 • OLAP
  Jeśli trzeba przejrzeć dużą ilość historycznych informacji w celach analitycznych, przedsiębiorstwa mogą skorzystać z przetwarzania informacji z wykorzystaniem wielowymiarowej bazy danych (OLAP). Zapytania OLAP zwykle używają wielowymiarowego modelu danych, choć niektóre korzystają także z relacyjnych modeli. Magazyny danych są wyspecjalizowanym rodzajem OLAP, zaprojektowanym specjalnie do analityki.

Obiektowe bazy danych

W obiektowej bazie danych informacje przedstawione są jako obiekty i klasy obiektów. Hybrydową formą obiektowych i relacyjnych baz danych, jest obiektowo-relacyjna baza danych.

Nierelacyjne bazy danych

Niekiedy nazywa się je bazami danych NoSQL. Nie są one związane strukturą tabeli. Te bazy danych zwykle korzystają z metadanych w celach organizacyjnych i są skuteczne w kwestii zarządzania niezbudowanymi oraz złożonymi danymi, takimi jak obrazy lub wideo. Przykładami popularnego oprogramowania dla nierelacyjnej bazy danych są MongoDB i Apache Cassandra.

 • Baza danych klucz-wartość
  Funkcjonuje również pod nazwą magazyn klucz-wartość. To najprostsza forma bazy danych NoSQL. Przykładami takich baz danych są Redis i Oracle. Wykorzystują one tabelę hash w celu przechowywania i odzyskiwania danych, za pomocą unikalnego „klucza” identyfikującego.
 • Magazyny szeroko-kolumnowe
  W magazynach szeroko-kolumnowych dane są przechowywane w kolumnach powiązanych informacji. Najpopularniejszym przykładem takiej bazy danych jest Cassandra, która oferuje skalowalność i szybkie zapytania dla dużych zestawów danych.
 • Dokumentowe bazy danych
  Funkcjonują też pod nazwą magazyny dokumentów. Przechowują dane w formie złożonych zapisów zwanych „dokumentami”, które obejmują metadane lub informacje o samych danych. Dokumenty mogą zawierać dowolny rodzaj danych, w tym obrazy i wideo.
 • Grafowe bazy danych
  To kolejny rodzaj bazy danych NoSQL. Oparte są one na strukturach grafowych, w celu zdefiniowania relacji o przechowywania danych. Grafowe bazy danych zostały stworzone by umożliwić szybkie zapytania i przetwarzanie dużych ilości danych dla mocno powiązanych informacji. Modele grafowej bazy danych są używane przez SAP HANA oraz OrientDB.

Innowacje od firmy Intel (od procesorów, po biblioteki i optymalizacje Java) pomagają organizacjom na całym świecie ulepszyć wydajność baz danych oraz ułatwiają zarządzanie nimi.

Technologie Intel® dla zarządzania bazą danych

Optymalizacja baz danych korzystających z masywnie skalowanych zestawów danych, wymaga sprzętu potrafiącego skutecznie obsługiwać taką bazę, a także obciążenia robocze związane z analityką.

Moc obliczeniowa i pamięć masową muszą współpracować bardzo wydajnie, przy trzymaniu się instrukcji przetwarzania powodujących szybki ruch zapytań i strumieni danych. Przechowywanie danych i dostęp do nich zależą od utrzymywania ich w warstwach, które automatycznie nadają priorytet ważnym oraz uwarunkowanym czasowo obciążeniom roboczym.

Firma Intel® napędza innowacje na poziomie krzemu, wykorzystując takie instrukcje, jak AVX-512 oraz TMUL, w celu przyspieszenia przetwarzania danych.

Oprócz wspierania baz danych za pomocą sprzętu zaprojektowanego z myślą o wydajności firma Intel® pracuje również nad udoskonalaniem otwartego oprogramowania. Cały zespół Intel® poświęca się optymalizacji Java, w którym to zadaniu celem jest przyspieszenie rozwoju w całym obszarze społeczności deweloperów otwartego oprogramowania i aplikacji baz danych.

Technologie i oprogramowanie Intel® do zarządzania bazą danych
Skalowalne procesory Intel® Xeon® Procesory skalowalne Intel® Xeon® najnowszej generacji obsługują wybrane przez Ciebie systemy baz danych oraz narzędzia, za pomocą optymalizacji w krzemie, stworzonymi w celu odciążenia baz danych oraz usprawnienia wydajności mocy obliczeniowej.
Pamięć trwała Intel® Optane™ Pamięć trwała Intel® Optane™ jest dołączona do skalowalnych procesorów Intel® najnowszej generacji. Oferuje ona zwiększenie wydajności dla szeregu platform i aplikacji DBMS, a także umożliwia optymalizację baz danych w pamięci masowej, pod kątem zaawansowanej analityki. 
Dyski Intel® Solid-State Drive (Intel® SSDs) Napędy SSD Intel®, w tym napędy Intel® Optane™ SSD oraz Intel® NVMe SSD, pozwalają przechowywać dane, zapewniając długi czas odczytu oraz ich trwałość. Bazy danych mogą przetwarzać ciągły strumień operacji odczyt-zapis, przy doskonałej długowieczności dysku.
Produkty Intel® Ethernet Karty sieciowe, sterowniki i akcesoria Intel® Ethernet mają szereg opcji GbE. Ogólnoświatowa dostępność i wszechstronne testy zgodności sprawiają, że produkty Intel® Ethernet są najchętniej wybierane do tworzenia połączeń z serwerami.
Biblioteki oprogramowania Intel® 1 Biblioteki oprogramowania Intel®, w tym zestawy Storage Performance Development Kit (SPDK) oraz Data Plane Development Kit (DPDK), przyspieszają rozwój zastosowań baz danych i pomagają programistom zoptymalizować wydajność bazy danych.

Dobry wybór bazy danych to zoptymalizowana wydajność

Skuteczna strategia analityczna zależy od właściwych technologii bazy danych, które współgrają z właściwym rodzajem danych. Wraz z rozwojem Twojej strategii analitycznej, korzystasz z coraz większej ilości rodzajów informacji przy różnych zastosowaniach. Jest zatem prawdopodobne, że Twoja organizacja będzie używać różnych typów baz danych, a także korzystać z usług wielu sprzedawców baz danych.

Dzięki naszej szerokiej gamie produktów i funkcji sprzętowych, stworzonych z myślą o bazach danych, a także bibliotek oprogramowania, narzędzi i optymalizacji, firma Intel® jest zaangażowana w optymalizację zarządzania bazami danych. Obsługujemy największe obecnie nazwy w zakresie technologii baz danych i troszczymy się o przyszłe innowacje, od krzemu, po rozwój oprogramowania.

Informacje o produktach i wydajności

1Kompilatory Intel® nie zawsze optymalizują w tym samym stopniu mikroprocesory innych firm w przypadku tych optymalizacji, które nie są specyficzne dla mikroprocesorów Intel®. Optymalizacje te obejmują zestawy instrukcji SSE2, SSE3 i SSSE3 oraz inne optymalizacje. Firma Intel nie gwarantuje dostępności, funkcjonalności czy skuteczności każdej optymalizacji w przypadku mikroprocesorów niewyprodukowanych przez firmę Intel. Optymalizacje dla tego produktu zależne od mikroprocesora przeznaczone są do użytku z mikroprocesorami Intel®. Niektóre optymalizacje niespecyficzne dla mikroarchitektury Intel® są zastrzeżone dla mikroprocesorów Intel®. Więcej informacji dotyczących konkretnych zestawów instrukcji objętych niniejszą uwagą prawną można znaleźć w materiałach informacyjnych i podręcznikach użytkownika właściwych dla produktu.