Deduplikacja danych polega na znalezieniu takich samych bloków danych w różnych plikach. Ich ilość w firmie potrafi osiągać nawet kilkadziesiąt procent. Identyczne bloki są wyszukiwane za pomocą zaawansowanych algorytmów, a następnie tworzona jest baza danych o zdublowanych blokach.

Deduplikacja danych to oszczędność. Deduplikacja opłaca się, jeżeli w bazie zostanie zidentyfikowanych już 10% dubletów (powtarzających się bloków).  Oznacza to, że jeżeli z bazy 1000 plików wykluczymy więcej niż 10% powtarzające się bloków, to zwróci się koszt deduplikacji, a znalezienie każdego kolejnego dubletu jest już czystym zyskiem.

Co nam daje w praktyce ?

W przypadku backupu danych przez sieć kopia wykonuje się znacznie szybciej i co więcej oszczędzamy też miejsce na dysku.