+48 669 STORIO (786746)

Twoja firma pod

szczególną ochroną

DataDomain - rozwiązanie do deduplikacji danych
EMC UNITY najnowsze macierze
Isilon - przechowywanie danych przez długie lata
UTM – czyli nowoczesne rozwiązania bezpieczeństwa sieci

Czym jest BoostFS?

Niedawno wprowadzona nowość w portfolio Data Domain to możliwość dedupliakcji na źródle dla wszystkich systemów backupowych, aplikacji, baz danych, skryptów itp. Ale nim przejdziemy do dokładnego opisu BoostFS, zaczniemy od wytłumaczenia czym w ogóle jest deduplikacja oraz deduplikacja na źródle. 

Od paru lat na rynku wyraźnie widać wzrost ilości danych do backupu. Stawia to przed administratorami systemów backupowych nowe wyzwania. Większa ilość danych oraz ograniczenia okien backupowych sprawiają iż tradycyjne metody backupu stają się nieefektywne oraz kosztowne. Co to jest i jak wygląda deduplikacja oraz jakie są jej atuty w przypadku DELL/EMC? 

Deduplikacja danych jest w pewnym sensie rodzajem “globalnej kompresji” wyszukującej podobieństwo w elementach backupowanego zbioru. Biorąc pod uwagę fakt iż konkretny blok danych zapisany jest na dysku tylko raz (a nie np. 30 razy) bez wątpienia zmniejsza zapotrzebowanie na pojemność dyskową. Możemy wyróżnić kilka typów deduplikacji, a prościej mówiąc to parę mechanizmów jej wykonywania:

Obszerniejszy opis procesu deduplikacji oraz dokładne wyjaśnienie pojęć jak współczynnik deduplikacji znajduje się na naszej stronie pod adresem: http://www.storio.pl/deduplikacja.html

 

Czym jest zatem deduplikacja na źródle zawarta w Data Domain BOOST?

Zacznijmy od tego, jacy producenci wspierają Deduplikację na źródle poprzez BOOST:

 

 

Co takiego daje nam deduplikacja na źródle i jak wygląda? Dzięki implementacji SHA-1 (Secure Hash Algorithm) w procesorach INTEL od 2010 r. możliwe stało się zastosowanie deduplikacji na szeroką skalę. Pozwala ona na wykorzystanie istniejącego w serwerach Intel koprocesora, który zajmuje się wykonywaniem operacji potrzebnych do deduplikacji na źródłowej maszynie.

Jakie są plusy używania deduplikacji na źródle? 

Źródłowa deduplikacja dostarcza nam zdecydowanie większą wydajność niż klasyczny backup. Odciąża nam istniejącą sieć, sprawia że backup wykonuje się o wiele szybciej i nie obciąża magazynu danych, w naszym przypadku Data Domain.  

Skoro wiemy już co to jest deduplikacja oraz czym charakteryzuje się protokół BOOST, czas byśmy przeszli do BoostFS. 

Data Domain Boost Filesystem (BoostFS) - używa tej samej technologii co BOOST, jego działanie jest identyczne i pozwala na deduplikację na źródle na maszynach klienckich. BoostFS pobiera się w postaci binariów dla systemu Linux. Jest on sterownikiem dla jądra systemu. W procesie instalacji następuje połączenie z Storage Unit na Data Domain, do którego klient na maszynie „montuje” folder znajdujący się na maszynie klienckiej (będącej źródłem). Może to być miejsce przechowywania backupu aplikacji, która nie współpracuje z BOOSTem bezpośrednio. Dla aplikacji/bazy danych/skryptu jest to folder fizycznie znajdujący się na maszynie klienckiej. BoostFS dzięki wbudowanemu mechanizmowi deduplikuje kopiowane do tego folderu pliki i przesyła unikalne bloki na macierz z funkcją deduplikacji. Plug-in emuluje strukturę drzewa katalogów na maszynie klienckiej, można je przeglądać za pomocą przeglądarek plikowych. Prawdą jest jednak, że unikalne bloki po deduplikacji zostały przesłane na Data Domaina i tam są składowane. Jak widać, za pomocą tak prostego rozwiązania jesteśmy wstanie szybko przesyłać dane na naszego Data Domaina, jednakże droga do tak efektywnego i szybkiego rozwiązania prowadzi przez zaawansowane mechanizmy całkowicie transparentne dla normalnego użytkownika maszyny klienckiej.  

Schemat działania BoostFS przedstawiono na załączonym obrazie:

Obecnie BoostFS wspiera system operacyjny Linux. Na grudzień 2016r wspierane są następujące dystrybucje:

BoostFS dla systemów Windows planowany jest na połowę 2017 roku wraz z pojawieniem się nowej wersji Data Domain OS.

BoostFS jest darmowy dla użytkowników, którzy posiadają licencję na BOOST i dostępny jest w wersji od Data Domain OS 6.0.
BoostFS jest plug-in’em, instalowanym na systemie operacyjnym. Pozwala nam na deduplikację na źródle dla:


Lista przetestowanych na dzień dzisiejszy aplikacji zgodnych z BoostFS:

Dla systemów bazodanowych Mongo różnicę po zastosowaniu BoostFS przedstawiono w tabeli:

 

Podsumowywując, BoosFS pomaga w: