Start » Archiwizacja i kopia zapasowa » Backup – pełny, przyrostowy, różnicowy, syntetyczny oraz forever-incremental
ransomware

Backup – pełny, przyrostowy, różnicowy, syntetyczny oraz forever-incremental

Rozwiązania służące do backupu maszyn wirtualnych działających w środowiskach bazujących na VMware lub Hyper-V różnią się od siebie w wielu aspektach, co mogłoby być tematem na obszerny artykuł. W tym artykule (i tak już pokaźnym) skupimy się jednak tylko na jednym z tych aspektów – na technikach wykonywania backupu, które są znane jako typy lub metody tworzenia kopii zapasowych. Poniżej zajmiemy się krótką charakterystyką tradycyjnych rodzajów backupu (pełny, przyrostowy, różnicowy), a także nowo powstałymi (forever-incremental oraz syntetyczny) i ich różnymi wariacjami (tzw. mirror, reverse-incremental, backup typu smart lub ciągły). Dzięki temu, będziemy mogli odnieść się do różnic między różnymi rodzajami backupu oraz przyjrzeć się zaletom jakie każdy z tych typów ma nam do zaoferowania.  

Pełny backup 

Jak łatwo domyślić się po nazwie, jest to po prostu całkowita kopia danych z miejsca źródłowego. Ten typ backupu jest uznawany za najlepszy możliwy z punktu widzenia prostoty i szybkości procesu odzyskiwania naszych danych. Jednakże, co również jest dość oczywiste, przez fakt, że kopiowane są wszystkie dane ze źródła, mamy dużą ilość danych, którą trzeba skopiować, co zajmuje po prostu sporo czasu (pełny backup może trwać nawet do 10x dłużej niż inne typy backupu!). Dodatkowo, nie da się ukryć, że za każdym razem, gdy uruchamiany jest backup pełny, wywiera on spore obciążenie sieci, co może istotnie wpływać na wydajność systemu czy po prostu kolidować z innymi działaniami, które w danej infrastrukturze mają miejsce. Oczywiście problem pojawia się też z punktu widzenia storage’u – jeśli robimy cały czas backupy pełne, to przestrzeń w naszym repozytorium może się bardzo szybko skończyć.   

 

To właśnie dlatego większość organizacji wykonuje pełne backupu jedynie czasami, łącząc je z innymi typami. Dlatego pełny backup często staje się początkiem wdrożenia innych rodzajów backupu w danej infrastrukturze.  

Podsumowując, niewątpliwymi zaletami pełnego backupu są: 

  • szybkie odzyskiwanie danych w przypadku awarii; 
  • lepsze zarządzanie przechowywaniem danych, bo znajdują się w jednym pliku. 

Jednakże ten typ wykonywania kopii zapasowych ma wiele wad: 

  • tworzenie pełnych backupów zajmuje dużo czasu; 
  • potrzebny jest bardzo pojemny storage, który pomieści regularnie wykonywane pełne backupy; 
  • każdy z pełnych backupów zawiera w sobie wszystkie dane całej twojej infrastruktury (często są to dane poufne). Z punktu widzenia ochrony danych krytycznych może to powodować zagrożenia z tytułu dostępu do danych osób do tego niepowołanych. Można tego jednak uniknąć, gdy twoje rozwiązanie do backupu oferuje funkcję szyfrowania kopii zapasowych (w przypadku NAKIVO szyfrowanie odbywa się z użyciem klucza AES-256, dzięki czemu eliminujemy to zagrożenie, dodatkowo QNAP NAS, na którym uruchamia się NAKIVO też ma możliwość szyfrowania dysków, więc zabezpieczenie jest podwojone). 

Backup przyrostowy (incremental) 

Backupy przyrostowe służą redukcji czasu i obciążenia sieci, które są potrzebne do wykonywania pełnych backupów. Punktem wyjścia do robienia backupów przyrostowych jest zrobienie pełnej kopii zapasowej. Następnie backup wykonywany jest na zasadzie porównywania infrastruktury obecnej ze stanem zapisanym w pełnej kopii. Zapisywane są jedynie te bloki danych, które uległy zmianie od czasu wykonania poprzedniego backupu. Zależnie od polityki retencji danych, po jakimś określonym czasie wykonywany jest kolejny pełny backup i cały cykl jest powtarzany.  

Dla zilustrowania sobie całego procesu backupu przyrostowego, wyobraźmy sobie, że wykonaliśmy pełny backup w poniedziałek, a przez resztę tygodnia wykonywaliśmy backupy przyrostowe. W takim wypadku, we wtorek zapisywane są jedynie te bloki danych, które uległy zmianie od pełnego backupu, w środę zapisywane zostają tylko te bloki danych, które uległy zmianie od wtorku, itd. Także backupy przyrostowe mogą być wykonywane niemal tak często jak chcemy, ponieważ zapisywane są tylko najnowsze zmiany (jeśli jakiekolwiek się dokonały).  

 

Dzięki temu backup typu przyrostowego wykonuje się szybciej, wywołuje mniejsze obciążenie infrastruktury i zajmuje mniej miejsca w repozytorium backupu. Jednakże dłuższy w tym przypadku jest proces odzyskiwania danych, bo trzeba „wyciągnąć” dane nie tylko z ostatniego pełnego backupu, ale także z całego łańcucha przyrostów, które zostały w międzyczasie wykonane. Dodatkowo, jeśli choć jeden z naszych przyrostów jest uszkodzony lub został w jakiś sposób usunięty lub nie zapisał się poprawnie, wykonanie pełnego odzyskania danych będzie niemożliwe.  

Zalety backupu przyrostowego: 

  • backup wykonuje się szybko; 
  • backup zajmuje mniejszą przestrzeń dyskową; 
  • backup może być uruchamiany bardzo często, bo nie wywołuje dużego obciążenia sieci. 

Wady backupu przyrostowego: 

  • wolne odzyskiwanie danych, ponieważ niezbędne jest odzyskiwanie danych z wielu punktów – zarówno backupu pełnego, jak i całej sieci przyrostów; 
  • skuteczność procesu odzyskiwania danych zależy od integralności wszystkich przyrostów z całego cyklu pomiędzy dwoma pełnymi backupami. 

Backup różnicowy 

Backup różnicowy jest typem pośrednim pomiędzy backupem pełnym, a przyrostowym. Podobnie jak w przypadku przyrostowego, punktem wyjścia dla backupu różnicowego jest pełny backup. Następnie zapisywane są jedynie te dane, które zmieniły się od tego pełnego backupu. Tutaj właśnie backup różnicowy różni się od przyrostowego. W przypadku przyrostowego zapisujemy zmiany dokonane od poprzedniego wykonanego zadania backupu, a w przypadku różnicowego, zapisujemy zmiany, które zaszły od pierwszego pełnego backupu. Z tego powodu pełny backup jest cały czas punktem odniesienia dla kolejnych zadań backupowych. Dzięki temu odzyskiwanie danych jest w przypadku backupu różnicowego szybsze niż w przypadku przyrostowego. Dzieje się tak, bo do odzyskania danych potrzebujemy informacji z dwóch miejsc – z pierwszego backupu pełnego oraz z ostatniego backupu różnicowego.  

 

Z punktu widzenia prędkości zarówno wykonywania backupu, jak i odzyskiwania danych, backup różnicowy jest gdzieś pomiędzy backupem pełnym, a przyrostowym: 

  • backup różnicowy wykonuje się szybciej niż pełny, ale wolniej niż przyrostowy 
  • dane z backupu różnicowego odzyskują się wolniej niż z pełnego, ale szybciej niż z przyrostowego 

Przestrzeń dyskowa do przechowywania backupów, w przypadku typu różnicowego jest , przynajmniej przez pewien czas, mniejsza niż ta, która potrzebna jest do przechowywania kopii pełnych, ale jest większa niż w przypadku backupu przyrostowego. Trzeba jednak uważać, bo z czasem zmiany, które przechowywane są w backupie różnicowym, czyli zmiany względem pierwszego pełnego backupu, mogą być większe niż rozmiar pełnego backupu. Wtedy być może bardziej opłacalne z punktu widzenia przestrzeni będzie wykonanie kolejnego pełnego backupu i rozpoczęcie cyklu na nowo.  

Backup typu mirror 

Ten typ backupu jest bardzo podobny do backupu pełnego, jednakże z dość istotną różnicą. Wykonywana jest dokładna kopia danych źródłowych, ale przechowywana jest tylko i wyłącznie najnowsza wersja. Nie mamy w przypadku mirrora kilku wersji, do których moglibyśmy się cofnąć. Kolejną różnicą jest sposób przechowywania danych, gdyż nie są one przechowywane w jednym pliku w postaci zaszyfrowanej i skompresowanej, a przetrzymywane są osobno, jako poszczególne pliki, dokładnie tak, jak ma to miejsce w lokalizacji źródłowej. Dzięki temu mamy bezpośredni dostęp do plików w naszej kopii zapasowych, nie musimy przeprowadzać żadnych operacji odzyskiwania danych. Dane przechowywane w repozytorium to po prostu lustrzane odbicie naszych danych źródłowych. Kopiowane są jedynie zmodyfikowane pliki. Nie można odmówić temu typowi backupu zalet, takich jak szybki dostęp do plików przechowywanych w backupie, które w razie potrzeby bardzo łatwo odzyskamy (duża wygoda), ale ma on także swoje wielkie wady, np. bardzo wysokie zapotrzebowanie na przestrzeń (tyle samo co dane źródłowe) czy wysokie ryzyko nieautoryzowanego dostępu do naszych danych. 

Kolejną rzeczą jest fakt, że backupu typu mirror należy używać z bardzo dużą uwagą. Jeśli jakiś plik zostanie usunięty z lokalizacji źródłowej, zostanie również usunięty z następnego backupu. Zostawia to bardzo duże możliwości modyfikowania czy usuwania plików przez osoby niepowołane, sprawia, że pliki są podatne na sabotaż, atak złośliwego oprogramowania czy po prostu ludzki błąd. Jeśli coś stanie się z plikiem na źródle, backup będzie uszkodzony w ten sam sposób.  

Backup typu reverse-incremental  

Tutaj, podobnie jak w innych typach backupu zaczynamy od stworzenia kopii pełnej. Następnie wykonywane są backupy przyrostowe, ale zamiast przechowywać kolejne wersje przyrostów, są one „wszczepiane” w pełny backup wykonany na początku, uzupełniając go tym samym o najnowsze zmiany danych. Co więcej, konkretne przyrosty po umieszczeniu ich w pełnym backupie, „przeskakują” w łańcuchu wersji backupu wstecz, za backup pełny. Dzięki temu pełny backup jest zawsze w łańcuchu różnych wersji najnowszym elementem, więc w każdej chwili można do niego sięgnąć po starsze wersje jakiegoś pliku.  

 

Backup tego typu ma bardzo dużą zaletę pod kątem szybkości odzyskiwania danych, bo przechowuje najbardziej aktualną wersję pełnego backupu.  

 

Backup typu smart 

Backup typu smart jest połączeniem backupów: pełnego, przyrostowego i różnicowego. Zależnie od celów backupu, a także dostępnej przestrzeni dyskowej, backup typu smart tak zarządza procesem tworzenia kopii zapasowych, aby zapewnić uczestnikowi wydajny backup, a także odpowiednio zarządzać przestrzenią dyskową. Ta metoda działa na zasadzie inteligentnego algorytmu by manipulować backupem, retencją oraz przechodzeniem między różnymi typami tworzenia kopii zapasowych. Poniższa tabela przedstawia schemat działania tego typu backupu: 

Backup nr  Akcja na źródle danych  Akcja backupu Smart 
1.  2GB danych początkowych  Backup 2GB – pełny backup 
2.  Zmiany – 500MB  Backup 500MB – przyrostowy 
3.  Zmiany – 500MB  Backup 500MB – przyrostowy 
4.  Zmiany – 500MB  Backup 500MB – różnicowy 
5.  Zmiany – 500MB  Backup 500MB – przyrostowy 
6.  Zmiany – 500MB  Backup 500MB – różnicowy + backupy nr 2 i 3 są usuwane 
7.  Zmiany – 500MB  Backup 500MB – przyrostowy 
8.  Zmiany – 500MB  Backup 500MB – różnicowy + backupy nr 4 i 5 są usuwane 
9.  Zmiany – 500MB  Backup 500MB – różnicowy + backupy nr 4 i 5 są usuwane 
10.  Zmiany – 500MB  Backup 500MB – różnicowy + backupy nr 6 i 7 są usuwane 

Używając tego typu backupu możesz spać spokojnie, bez stresu, że przestrzeń na QNAP NAS się wyczerpie.  

Backup ciągły (ang. Continuous Data Protection – CDP) 

W odróżnieniu od innych backupów, które przebiegają w sposób cykliczny, zgodny z ustalonym harmonogramem, backup CDP przechowuje każdą zmianę w danych źródłowych, podobnie jak backup typu mirror. Różnica między backupem ciągłym, a mirrorem polega na tym, że w przypadku ciągłego możemy się cofnąć i odzyskać starsze wersje danych, które zostały zmienione.  

Backup pełny syntetyczny (full synthetic) 

Backup pełny syntetyczny jest bardzo zbliżony do typu reverse-incremental. Różnica jest w sposobie manipulowania danymi. Backup syntetyczny rozpoczyna się od backupu pełnego, a następnie wykonuje serię backupów przyrostowych. W pewnym momencie przyrosty są składane w całość i implementowane do pełnego backupu, który staje się w tym momencie nowym punktem startu.  

 

Backup syntetyczny zawiera w sobie wszystkie zalety regularnych, pełnych backupów, zajmując w tym samym czasie znacznie mniej przestrzeni dyskowej i wykonując się szybciej. 

Zalety backupu syntetycznego: 

  • szybki zarówno backup, jak i proces odzyskiwania danych; 
  • lepsze zarządzanie przestrzenią; 
  • nieduże potrzeby przestrzeni dyskowej 
  • niskie obciążenie sieci 

Backup typu forever-incremental 

Różnica między typowym backupem przyrostowym (incremental), a backupem typu forever-incremental leży w organizacji i procesowaniu samego backupu danych. Tak jak wszystkie w/w typy backupu, forever-incremental zaczyna się od wykonania pełnej kopii, która staje się punktem referencyjnym śledzenia zmian. Od tego momentu wykonywane są tylko backupy przyrostowe, bez tworzenia od czasu do czasu kopii pełnej – stąd też nazwa tego typu. 

Aby zobrazować działanie, wyobraźmy sobie, że wykonaliśmy pełny backup w sobotę. Od następnego dnia, codziennie wykonywane są kopie przyrostowe. W niedzielę, dwa nowe bloki A i B zostają stworzone w lokalizacji źródłowej. W poniedziałek blok A zostaje usunięty, a pojawia się nowy blok C. We wtorek usunięty zostaje blok B i pojawia się nowy blok D. W przypadku backupu forever-incremental, system wykonywania kopii zapasowych śledzi wszystkie dzienne zmiany, usuwając wszystkie zduplikowane bloki danych aby zredukować przestrzeń potrzebną do przechowania backupu w repozytorium. W tym samym czasie tworzone są odpowiednie referencje do punktów odzyskiwania wskazujących powiązane bloki danych i sekwencje odzyskiwania. 

 

Zależnie od indywidualnych polityk retencji backupu, po stworzeniu serii przyrostów, stare dane są kasowane by zwolnić przestrzeń w repozytorium backupu. Podczas konfigurowania polityki retencji danych ustala się liczbę punktów odzyskiwania, które chcemy przechowywać (w przypadku NAKIVO Backup & Replication może to być nawet 1000 punktów dzięki polityce retencji Grandfather-father-son – GFS). Wszystkie przechowywane dane są organizowane w taki sposób, aby zarówno pierwotny pełny backup, jak i później wykonywane przyrosty, pozwalały wspólnie przeprowadzić operację odzyskiwania danych. 

Zalety backupu typu forever-incremental pokrywają się z tymi, o których mówiliśmy przy pełnym backupie syntetycznym, czyli: 

  •  szybki zarówno backup, jak i proces odzyskiwania danych; 
  • lepsze zarządzanie przestrzenią; 
  • nieduże potrzeby przestrzeni dyskowej 
  • niskie obciążenie sieci 

Podsumowanie 

Z jednej strony nie ma jednoznacznie dobrego lub złego typu backupu. Najważniejsze jest rozważenie istniejących metod i wybranie dla siebie tej, która najlepiej pasuje do potrzeb i posiadanej infrastruktury. Te są różne w zależności od organizacji, polityki ochrony danych, dostępnej przestrzeni na serwerze QNAP NAS, zasobów, pasma sieciowego, rodzaju danych krytycznych, różnych umów serwisowych, itd. Z drugiej zaś strony, backupy typu forever-incremental oraz full synthetic znacząco zmodernizowały proces wykonywania backupu oraz najbardziej aktualne techniki ochrony danych, które zostały zaprojektowane by sprostać wymaganiom większości organizacji.  

Powyższy artykuł powstał dzięki firmie NAKIVO nowoczesnego rozwiązania do natywnego backupu maszyn wirtualnych, które wykorzystuje backup typu forever-incremental do tworzenia kopii zapasowych maszyn wirtualnych, a także tzw. „full synthetic mode” do przechowywania kopii maszyn wirtualnych w repozytorium backupu. NAKIVO oferuje również cały zakres świetnych technologii i funkcji zebranych w jednym rozwiązaniu, takich jak, np. natywne dla VMware i Hyper-V mechanizmy śledzenia zmian, czyli CBT i RCT, deduplikację danych na poziomie globalnym, szyfrowanie danych oraz ich kompresję, pomijanie plików i partycji SWAP, funkcję tzw. przyspieszenia sieciowego, narzędzia do planowania zadań backupu w czasie oraz integrację z serwerami QNAP NAS oraz serwisami chmurowymi.  

O Jakub Stachecki

Jakub Stachecki
Świeżo upieczony mąż, opiekun psa mylonego z lisem, miłośnik górskiego trekkingu, fan angielskiej piłki nożnej oraz urządzeń Apple'a. Zawodowo handlowiec w firmie FEN. Lubi nawiązywać nowe znajomości i eksperymentować w kuchni, a swoje wynalazki testuje na żonie.