Rozpoczęła się era post-RAID, podczas gdy macierze RAID wcale nie odchodzą do lamusa.

Dlaczego teraz?

Alternatywa dla RAID istnieje już od dawna.

  • Autorzy oryginalnego dokumentu opisującego RAID (Patterson, Gibson i Katz), który powstał w 1988, pracują nad nowymi projektami: Patterson nad skalowalnym przechowywaniem obiektów; Gibson założył własną firmę zajmujące skalowalnym przechowywaniem obiektów; natomiast Katz pracuje nad Hadoop i wieloma pokrewnymi projektami.
  • Prawdopodobnie najszybciej rozwijającymi się infrastrukturami do przechowywania danych na świecie to Google i Amazon –  co je łączy, nie bazują tylko na technologi RAID.
  • Główni producenci serwerów NetApp, HP, EMC i Hitachi zainwestowali – i sprzedają – systemy bez RAID.
  • To wszystko przez kody „erasure Reed-Solomon”

Jak działają kody erasure?

RAID wykorzystuje kody „erasure” do tworzenie informacji parzystości, które chronią macierz RAID przed URE (uncorrectable read errors).

Kody „erasure” rozbijają dane na n segmentów, dodając m dodatkowych fragmentów, przechowując n+m na różnych urządzeniach potrafią odtworzyć dane z każdego n urządzeń. W RAID5 skonfigurowanym na 8 dyskach, oryginalne dane są podzielone na 7 fragmentów, a ósmy fragment to – informacja parzystości – każdy z 8 dysków może ulec awarii, a my teoretycznie nie powinniśmy stracić żadnych danych.

Problem z RAID5 jest taki, że przy zastosowaniu dużych dysków, czas potrzebny na odbudowę macierzy, jest bardzo duży, co zwiększa ryzyko wystąpienia kolejnego URE podczas odbudowy, tym samym powodując utratę danych. W dzisiejszych czasach podstawa to zabezpieczenie przed dwoma URE.

W latach 90-tych powstała nowa forma kodów „erasure”, która umożliwiła tworzenie kodów z dowolną redundancją – zwanych jako kody „fountain” lub „ratelesserasure”. Startupy takiej jak Digital FountainCleversafe i Amplidata postanowiły skorzystać z możliwości jakie dają nowe kody.

Poniższe wideo zamieszczone przez StorageMojo pokazuje plusy wykorzystywania kodów „rateless”, używanych przez Amplidata. Jedną z głównych zalet to redundancja zapewniająca przetrwanie 4 awarii. Czyli znacznie lepiej niż 3 x krotna replikacja jaką wykorzystują w swojej infrastrukturze Amazon i Google.

Pamiętaj, że RAID nie zniknie, ale zostanie odsunięty na margines przez swoje ograniczenia i niskie koszty wdrożenia nowych alternatywnych technologii.

Mimo iż wiele firm nadal inwestuje w RAID, to teraz mamy nowe, lepsze rozwiązanie. Sprzedawane w odpowiedniej cenie może być kolejnym krokiem milowym w rozwoju infrastruktury „storage”.

Poniżej inne wideo pokazujące jak kody erasure można wykorzystać do ochrony danych w infrastrukturze cloud storage.

 

 

Jeżeli chodzi o cloud storage i wykorzystanie technologii kodów „erasure” do zabezpieczenia danych w chmurze to jako świetny przykład można tutaj przetoczyć rozwiązania CTERA Protal firmy CTERA Networks.

CTERA Portal to skalowalna platforma, świadcząca usługę cloud storage, umożliwiająca wykonywanie kopii zapasowych z urządzeń zdalnych na serwer centralny. Ctera Portal umożliwia zdalne zarządzanie zdalnymi serwerami Ctera z serii CloudNAS (C800,C400, C200, CloudPlug), scentralizowany monitoring wszystkich urządzeń podpiętych do portalu i udostępnia interfejs webowy do zarządzania usługą kopii zapasowej online.