Strefa wolna od botów!
Piszemy my, nie maszyny.

Autonomiczne bazy danych — rewolucja czy ewolucja w podejściu do przetwarzania danych?

Jak powiedział Doug Fisher, jeden z wiceprezesów Intela – „Dane są dla XXI wieku tym, czym ropa naftowa dla wieku XX”.[i] Nic zatem dziwnego, że po autonomicznych samochodach i dronach bojowych[ii]  przyszła kolej na autonomiczne bazy danych. W marcu 2018 roku światło dzienne ujrzała pierwsza tego typu baza Oracle Autonomous Data Warehouse Cloud, w pełni zarządzana przez algorytmy AI (Artificial Intelligence).

Wszystko zatem wskazuje na to, że zawód administratora baz danych już niedługo przejdzie do lamusa. Odpowiadając na tytułowe pytanie – rewolucja, czy ewolucja, to zdecydowanie ewolucja – już od wielu lat widać w IT trend do automatyzacji, a autonomiczność dopiero nabiera rozpędu.

 

 

Czym są autonomiczne bazy danych?

 

Na podstawie dostępnych danych można pokusić się o definicję, która mówi, że autonomiczna baza danych to rozwiązanie chmurowe, które wykorzystuje algorytmy uczenia maszynowego ML (Machine Learning) do automatyzacji rutynowych zadań w ramach systemu do zarządzania bazami danych. W szczególności dotyczy to instalowania aktualizacji, optymalizacji baz danych, zapewnienia bezpieczeństwa oraz tworzenia kopii zapasowych.

Niektórzy szacują, że redukcja zapotrzebowania na usługi administratorów baz danych może sięgnąć ponad 90%[iii]. Dziesiątki, jeśli nie setki ustawień inicjalizacyjnych, parametrów konfiguracyjnych baz danych, parametrów systemów operacyjnych i aplikacji biznesowych już teraz są zarządzane przez algorytmy zdolne do samodzielnego uczenia się. Na dodatek, w środowisku chmurowym użytkownik końcowy nie musi się martwić o wiele innych parametrów i ustawień, bo to dostawca usług dba o aktualność i bezpieczeństwo całego środowiska.

Autonomiczne bazy danych zapewniają wysoki stopień automatyzacji zadań operacyjnych, w tym indeksowania oraz zmiany konfiguracji i ustawień. Środowisko pracy musi być bezpieczne i dobrze chronione przed atakami z zewnątrz – autonomiczna baza danych musi sama dbać o realizację i aktualizację polityki bezpieczeństwa. Domyślnie wszystkie dane są szyfrowane. W kwestii bezpieczeństwa autonomiczne bazy danych oferują bardzo wysoki poziom ochrony , a tworzenie kopi zapasowych jest w pełni zautomatyzowane. Nad stanem bazy danych czuwają algorytmy AI. Wszystko to powoduje, że autonomiczne bazy danych mogą gwarantować dostępność danych na poziome 99,995%.

 

 

Jak działają autonomiczne bazy danych?

 

Skoro baza danych jest autonomiczna, to oznacza, że niezbędność ludzkiej pracy jest ograniczona do absolutnego minimum. Role i funkcje pełnione przez człowieka przejęły algorytmy AI  i ML. To one do spółki realizują wszystkie procesy zarządzania bazą danych i niezbędną infrastrukturą.

Autonomiczne bazy danych samodzielnie tworzą indeksy pamięci masowej, inteligentnie zarządzają pamięcią podręczną flash i optymalizują zapytania. Te zaawansowane algorytmy działające w tle powodują, że nie ma już potrzeby manualnego tworzenia indeksów, partycji, widoków zmaterializowanych, statystyk w celu optymalizacji obciążeń bazodanowych. Algorytmy ML obserwują aktywność bazy danych, potrafią rozpoznać anomalie i podjąć odpowiednie czynności naprawcze poprzez dostrojenie najważniejszych zasobów takich, jak moc obliczeniowa procesora, objętość pamięci masowej, czy przepustowość sieci. Umiejętne balansowanie zasobami i obciążeniami zapobiega spowolnieniu obsługi procesów biznesowych i uniemożliwia monopolizację zasobów przez jedno zadanie wsadowe, czy aplikację.

Na przykład autonomiczna baza danych Oracle zapewnia takie zasoby, jakie są rzeczywiście niezbędne w danym momencie, a co najważniejsze  – są one wyłączane, jeśli okazują się zbędne. W takim modelu opłaty są naliczane wyłącznie za rzeczywiste użycie bazy danych, co pozwala na optymalizację i redukcję kosztów utrzymania infrastruktury bazodanowej w organizacji.

Dodatkowe oszczędności w autonomicznych bazach danych generują mechanizmy automatycznego pobierania i instalowania poprawek i aktualizacji. Wyeliminowanie w tym zakresie pracy administratorów to nie tylko kwestia finansów, ale zwiększenia poziomu bezpieczeństwa danych – eliminuje się w ten sposób ludzkie błędy i zaniedbania, które odpowiadają za większość przestojów w pracy baz danych.

Pełne natywne szyfrowanie danych i system autoryzacji uniemożliwia dostęp do danych osobom bez odpowiednich uprawnień. Automatyczne i szybkie aktualizacje bezpieczeństwa chronią przed cyberatakami i zagrożeniami z wewnątrz organizacji.

Chyba po raz pierwszy, jak powiedział Larry Ellison, szef Oracle, boty walczą z botami[iv] – boty chroniące autonomiczne bazy danych są w stanie odpierać zmasowane ataki złośliwych botów z dużo większą szybkością i skutecznością niż byłby w stanie zrobić to człowiek. Szacuje się, że autonomiczne bazy danych mogą wymagać mniej niż 2,5 minuty przestojów na miesiąc[v], głównie na instalowanie poprawek. Na dodatek, jeśli aplikacje biznesowe działają nieprzerwanie, to wykonywanie kopii bezpieczeństwa też zachodzi płynnie i bez przestojów tak, aby zminimalizować jakiekolwiek ryzyko utraty danych.

Działanie takich baz w środowisku chmurowym oznacza również praktycznie nieograniczoną skalowalność. Serwer bazy danych w odpowiedzi na zmieniające się zapotrzebowanie ze strony użytkowników może równocześnie zmieniać zapotrzebowanie na moc obliczeniową i zasoby pamięci. W ten sposób system może płynnie zmieniać liczbę wykorzystywanych rdzeni procesora, całych węzłów obliczeniowych lub serwerów pamięci masowej.

Na przykład na czas generowania raportów kwartalnych organizacja może zamówić np. osiem rdzeni zamiast zwykle wykorzystywanych czterech. Można także np. na czas weekendu wyłączyć całą moc obliczeniową, a od poniedziałku znów uruchomić niezbędną infrastrukturę. Taki sposób optymalizacji  zasobów oznacza realne i wcale niemałe oszczędności.

 

 

Czym autonomiczna baza danych różni się od tradycyjnej? 

 

Jak sama nazwa wskazuje, autonomiczna baza danych działa samodzielnie, bez ingerencji człowieka. Realizację zdań administracyjnych nadzorują algorytmy AI i ML . Wyeliminowanie człowieka oznacza usunięcie najsłabszego ogniwa w łańcuchu zabezpieczeń baz danych, bo to ludzie mylą się najczęściej, zaniedbują obowiązki i zapominają o podstawowych czynnościach administracyjnych. Każdy z tych czynników to ryzyko utraty danych bądź ich dezaktualizacji.

Obrazowo mówiąc, różnica pomiędzy autonomiczną bazą danych a klasyczną jest taka, jak pomiędzy arkuszem kalkulacyjnym Excel a systemem ERP. Niby funkcje podobne, ale różnica jakościowa jest ogromna.

Autonomiczne bazy danych spotyka się zarówno w hurtowniach danych, jak i systemach transakcyjnych. Oznacza to, że spektrum możliwych zastosowań jest bardzo szerokie, ale ze względu na stopień zaawansowania technologicznego i ceny, jest to raczej rozwiązanie klasy Enterprise. W najbliższym czasie trudno oczekiwać, aby autonomiczne bazy danych zastąpiły tak popularne i darmowe rozwiązania, jak mySQL. Jednak w dużych przedsiębiorstwach z wielkimi bazami danych czas na autonomiczne bazy danych już nadszedł. Ich obecność wpłynie także na większą efektywność systemów ERP do zarządzania przedsiębiorstwem, gdzie będzie można oczekiwać większego skupienia się organizacji na optymalizacji procesów biznesowych.

 

 

Jakie są korzyści z używania autonomicznych baz danych?

 

Skoro administratorom baz danych spadły z listy obowiązków tradycyjne czynności, to mogą się oni skupić na zdecydowanie istotniejszych zadaniach. Wiedza i doświadczenie takich ludzi powinny zostać ukierunkowane na planowanie strategii agregacji danych, modelowanie, przetwarzanie i zarządzanie danymi. Administratorzy mogą być efektywnym łącznikiem pomiędzy programistami aplikacji a bazami danych, pomagając w efektywnym wykorzystaniu dostępnej funkcjonalności tak, aby minimalizować zmiany w kodzie aplikacji.

Z punktu widzenia całej organizacji liczy się przede wszystkim szeroko pojęta elastyczność autonomicznych baz danych, która wpływa na szybkość działania biznesu, znacząco skracając czas na uruchomienie usług i infrastruktury IT na potrzeby konkretnych zdań i projektów. Dzięki temu, że silnik bazy autonomicznej jest zoptymalizowany pod kątem najwyższej wydajności i dostępności, zmniejsza się zapotrzebowanie na zasoby i moc obliczeniową w porównaniu do klasycznych baz danych. W przypadku zmiennych i nierównych obciążeń, ułatwiona i zautomatyzowana skalowalność pozwala płacić jedynie za realne zużycie zasobów bez konieczności zatrzymywania lub spowalniania procesów biznesowych – dodatkowe zasoby są przydzielane lub zwalniane niemal natychmiast. W konsekwencji, użytkownicy autonomicznych baz danych mogą liczyć na znaczną redukcję całkowitych kosztów posiadania takiego rozwiązania.

 

 

Czy autonomiczne bazy danych są przyszłością analizy dużych zbiorów danych?

 

Wraz z upowszechnianiem się technologii 5G i Internetu rzeczy IoT (Internet of Things) ilość danych generowanych i używanych przez firmy będzie nieprawdopodobnie duża. Zbiory o wielkości setek petabajtów nie będą niczym niezwykłym. Dla organizacji wyzwaniem będzie nie tylko bezpieczne przechowanie tych danych, ale i ich sensowne wykorzystanie. Szybki i płynny potok danych niezbędnych do podejmowania decyzji biznesowych na każdym szczeblu zarządzania będzie wymagał nowej, złożonej architektury do zarządzania bazami danych. Bez wsparcia ze strony autonomicznych baz danych, zadanie serwisowe byłby nadmiernym obciążeniem dla administratorów, którzy i tak muszą przeprowadzać wyszukiwanie, przekształcanie, maskowanie i oczyszczanie danych tak, aby z kolei analitycy mogli wykonać swoje zadania.

Autonomiczne bazy danych i administratorzy wzmacniający siły analityczne organizacji są odpowiednią kombinacją ludzi i algorytmów w dziele analizy danych biznesowych. Przy dużych zbiorach danych każde, nawet minimalne usprawnienie może w dużej skali przynieść poważne oszczędności. Modelowanie danych w autonomicznych bazach danych będzie najbardziej pożądaną umiejętnością. Zdolność do tworzenia i modyfikowania modeli logicznych,  wielowymiarowych kostek danych oraz modeli typów danych będzie bardzo pomocna w planowaniu i realizacji najlepszych sposobów wykorzystania danych w aplikacjach biznesowych.

[i] https://businessinsider.com.pl/technologie/nowe-technologie/oracle-open-world-premiera-autonomicznej-bazy-danych/gp5my62

[ii] https://businessinsider.com.pl/technologie/nowe-technologie/oracle-open-world-premiera-autonomicznej-bazy-danych/gp5my62

[iii] https://www.computerworld.pl/news/Autonomiczna-Baza-Danych-Oracle,412160.html

[iv] https://diginomica.com/oracle-openworld-2018-ellison-makes-convincing-pitch-on-automation-and-security-for-oracle-cloud-2-0-but-cant-resist-trashing-aws

[v] https://www.oracle.com/pl/autonomous-database/what-is-autonomous-database/

Porozmawiajmy!

    Wypełnij formularz,
    a my pomożemy Ci wdrożyć najnowsze rozwiązania!