Każda firma, która rozważa przejście z modelu DAS (Direct Attached Storage) do SAN (Storage Area Network) stanie przed koniecznością fundamentalnego wyboru pomiędzy dwiema technologiami łączy: ustabilizowaną, ale drogą FC (Fibre Channel) i przystępniejszą cenowo, ale wciąż owianą wieloma mitami iSCSI (Internet SCSI). Wybór optymalnego interfejsu dla swojego środowiska to kwestia rozważenia wielu różnych czynników, takich jak wydajność, skalowalność i dystans. Ważne jest też zwrócenie uwagi na różne aspekty związane z prowadzonym biznesem, jak rodzaj wykorzystywanych aplikacji, budżet, wyszkolenie personelu i jego dostępność.Oto kluczowe cechy technologii SAS, FC i iSCSI, które obecnie są najczęściej wykorzystywane w centrach danych:

Serial Attached SCSI (SAS) – interfejs polecany przede wszystkim początkującym użytkownikom, korzystającym nadal z modelu DAS. W sieci możliwe jest udostępnienie zasobów macierzy z interfejsem SAS poprzez dodatkowy serwer.
• zalety: niski koszt, duża wydajność, łatwość obsługi
• wady: krótkie odległości połączeń, brak wsparcia dla połączeń sieciowych
• optymalne środowisko: urządzenia pamięci masowych dołączone bezpośrednio do serwerów, systemy wymagające dużych przepustowości

Fibre Channel (FC) – interfejs, który obecnie dominuje w architekturach sieci pamięci masowych (SAN) w przedsiębiorstwach. Jego pozycja w największych środowiskach raczej jest niezagrożona
• zalety: duża wydajność, skalowalność, niezawodność i dostępność
• wady: duży koszt i poziom skomplikowania
• optymalne środowisko: duże centra danych, systemy wymagające dużych wydajności

Internet SCSI (iSCSI) – protokół transmisji komend SCSI oparty na sieci IP. Relatywnie nowy, ale zaskarbiający sobie coraz więcej zwolenników.
• zalety: niski koszt, duża wydajność, łatwość obsługi
• wady: niewystarczająca wydajność dla najbardziej wymagających aplikacji
• optymalne środowisko: pamięci masowa udostępniana w sieci, gdzie od wydajności ważniejszy jest aspekt konsolidacji

Jak widać z powyższego zestawienia, gdy chcemy udostępnić systemy storage w sieci, za rozwiązaniami iSCSI przemawiają prostota i dość niski koszt rozbudowy. Zważywszy że podłączenie serwera do sieci FC wymaga zainstalowania drogiego kontrolera HBA, sterowników i oprogramowania zarządzającego, tak podłączenie serwera do sieci iSCSI może nastąpić poprzez zwykły kontroler Gigabit Ethernet, dostępny obecnie w większości serwerów. Co prawda jest wymagana aplikacja, która udostępnia zasoby poprzez połączenie ethernetowe, ale dla większości platform jest ona bezpłatna.

W poszukiwaniu wąskich gardeł…

Bardzo często próba porównania wydajności systemów iSCSI i Fibre Channel to jedno wielkie nieporozumienie. Głównym argumentem zwolenników Fibre Channel jest twierdzenie, że nawet tak „wolne” łącze jak FC 2 Gb jest szybsze niż najpopularniejszy obecnie interfejs Etherner 1 Gb i przyłączone do niego macierze iSCSI. Tymczasem rzeczywista prędkość działania systemów pamięci masowych w obu przypadkach jest porównywalna.

Przepustowość łącza to tylko jeden z wielu parametrów, który powinien być wzięty pod uwagę przy analizowaniu ogólnej wydajności systemu pamięci masowych. I jest to z reguły najszybszy parametr. Szybkość tego parametru ma znaczenie, gdy macierz jest mocno obciążona i są z niej pobierane duże pliki. Jednak w znakomitej większości przypadków zapytania do macierzy są znacznie mniejsze, a więc kontroler macierzowy musi skupić się na przetworzeniu tych danych, dla wydajności większe znaczenie w tym momencie zyskują parametry procesorów, pamięci podręcznej, częstotliwość taktowania magistrali i wydajność samych twardych dysków.

Jeżeli nie korzystamy z aplikacji intensywnie wysycających przepustowość łącza (takich jak np. streaming danych multimedialnych lub backup), różnica w wydajności powinna być minimalna. Testy przeprowadzone w laboratoriach Enterprise Strategy Group pokazały, że różnica w wydajności takich samych systemów z interfejsami iSCSI i FC była minimalna – wahała się między 5 i 15% na korzyść FC. Natomiast cena infrastruktury FC była jednocześnie kilkukrotnie wyższa. Odpowiednio dostrajając system w niektórych przypadkach uzyskano nawet lepszą wydajność w macierzy iSCSI niż Fibre Channel.

Szczególną uwagę należy zwrócić na wykorzystywane twarde dyski – ponieważ jest to mechaniczne urządzenie, średni czas dostępu do danych jest w nich kilkadziesiąt razy dłuższy niż w przypadku komponentów elektronicznych, jak procesory czy pamięć. Czas wyszukiwania danych w twardych dyskach to najwolniejszy element w wydajności systemu pamięci masowych.


Główne koszty sieci pamięci masowych

Koszt to nadal jeden z głównych czynników decydujących o wyborze infrastruktury Fibre Channel czy iSCSI. Powinien być rozpatrywany w czterech obszarach: łączność z serwerami, łączność z pamięciami masowymi, przełączniki sieciowe i okablowanie.

Po stronie serwerów, jako że iSCSI korzysta z protokołu transmisji Ethernet, nie ma konieczności kupowania oddzielnej karty sieciowej, tym bardziej, że dziś są w nie wyposażone wszystkie płyty główne. Ale nie ma nic za darmo – w tym modelu często zdarza się, że taka karta sieciowa jest w stanie obciążyć procesor nawet w 80%. Rozwiązaniem są specjalne „odciążające” karty TCP Offload Engine, które przejmują na siebie przetwarzanie ruchu TCP, odciążając tym samym procesor. Zarówno dla FC jak i iSCSI można też skorzystać ze specjalizowanych kart Host Bus Adapter (HBA) wyposażonych w procesor i pamięć, które całkowicie przejmują na siebie pracę związaną z obsługą transmisji.

W prawidłowo zaprojektowanej infrastrukturze SAN powinno się dublować ścieżki sieciowe pomiędzy serwerami i przełącznikami, to jednak podnosi koszt nie tylko o cenę HBA, okablowania i portów w przełącznikach, ale w przypadku Fibre Channel także konieczne jest zainstalowanie oprogramowania do zarządzania tak stworzonymi połączeniami – większość systemów operacyjnych ma wbudowane takie wsparcie dla protokołu iSCSI.

Kolejnym elementem, gdzie jest duża różnica kosztów między iSCSI i Fibre Channel, są przełączniki. Podczas gdy iSCSI korzysta ze zwykłych przełączników Ethernet, do obsługi Fibre Channel są potrzebne specjalne przełączniki, które nie są tak popularne, a więc tym samym droższe (jeden port w przełączniku FC średnio jest 3-5 razy droższy niż w zaawansowanym przełączniku Ethernet).

Ogromne oszczędności można uzyskać przy okablowaniu – dane protokołu iSCSI mogą być przenoszone poprzez miedziane okablowanie kategorii 6., które kosztuje ok. 5-10% ceny okablowania optycznego, koniecznego do obsługi Fibre Channel.

Prędkość rozwiązania iSCSI czy FC nie ma tak dużego znaczenia jak miejsce, gdzie będzie ono zastosowane. Na przykład firmy stosujące już rozwiązania FC mogą wykorzystać iSCSI do zdalnego zarządzania serwerami lub pamięciami masowymi w odległych centrach danych przez sieć WAN. Dla wielu firm wybór będzie związany także z kosztem zatrudnienia lub przeszkolenia zespołu do opieki nad rozwiązaniami FC – znacznie wyższym, niż ma to miejsce w przypadku iSCSI. Ale gdy firma już taki zespół posiada, może okazać się, że przy spadających cenach rozwiązań FC wchodzenie w nowy standard to po prostu niepotrzebny wysiłek.

Przed wdrożeniem rozwiązania iSCSI warto sprawdzić przede wszystkim czy wydajność sieci Ethernet w przedsiębiorstwie jest wystarczająca do obciążenia jej dodatkowymi pakietami iSCSI, konieczna może okazać się pewna rozbudowa. Warto też upewnić się, czy sieć pozwala na segmentację i izolację ruchu iSCSI poprzez VLAN, aby zapewnić bezpieczeństwo danych.

Analitycy Forrester Research wykonali proste porównanie kosztów przyłączenia jednego serwera do systemu pamięci masowej poprzez protokół iSCSI i Fibre Channel, każdy w dwóch wariantach – bardziej i mniej zaawansowanym. Jak widać z poniższego zestawienia, koszt w przypadku bardziej zaawansowanej instalacji różni się niemal czterokrotnie, a przy wersji low-end – ponad sześciokrotnie.

Czy FCoE zagrozi iSCSI?

Fibre Channel over Ethernet (FCoE) to nowy protokół, który wprowadził technologię Fibre Channel do środowiska Ethernet. Aby dać administratorom więcej swobody przy budowaniu środowisk sieciowych dla pamięci masowych protokół FCoE łączy dwie technologie – protokół Fibre Channel, wykorzystywany do budowy sieci SAN oraz infrastrukturę Ethernet, wykorzystywaną obecnie w niemal wszystkich serwerach i centrach danych.

Protokół FCoE jest też odpowiedzią na potrzebę konsolidacji środowisk centrów danych, gdzie konsolidowane są nie tylko serwery i pamięci masowe, ale także ruch sieciowy. Przy konsolidacji ruchu sieciowego najważniejsze jest, aby nie dopuścić do sytuacji, gdzie jedna klasa ruchu uniemożliwia transport danych z innej klasy.

Czym zatem FCoE różni się od iSCSI? Przy protokole iSCSI dane są przesyłane poprzez warstwy TCP/IP. Protokół FCoE zastępuje te warstwy, ale ich brak powoduje, że ten nie może on być routowalny poprzez tradycyjne rozwiązania (routing protokołu FCoE może być wykonany przy pomocy protokołu FCIP). Wadą protokołu FCoE jest też to, że nie może on być wdrożony w sieci podatnej na utraty pakietów, podczas gdy dla iSCSI nie stanowi to problemu.

W centrach danych dużych firm iSCSI najczęściej jest wdrażane w warstwie drugiej i trzeciej w systemach pamięci masowych. W mniejszych firmach i w oddziałach firm najczęściej jest to główna technologia transportu danych pomiędzy serwerami i pamięciami masowymi. Najwięcej problemów standard iSCSI sprawia tam, gdzie skonsolidowano wiele ważnych dla funkcjonowania biznesu aplikacji Windows, a dodatkowo transfer danych odbywa się poprzez sieć Gigabit Ethernet.

Fibre Channel zwyczajowo jest wdrażany w warstwie pierwszej w centrach danych dużych firm, z reguły protokół ten obsługuje krytyczne aplikacje w środowiskach Unix i Windows, takie jak bazy i hurtownie danych, czy ERP. Obecnie większość instalacji jest wykonanych w standardzie FC 4 i 8 Gb/s. Dla oddziałów firm podstawową przewagą protokołu iSCSI jest to, że można go routować na znacznie dalsze odległości niż FCoE, który wymaga dodatkowych mostów ethernetowych.

Podsumowując, do wyboru odpowiedniego modelu transportu danych w sieci pamięci masowych warto nie tylko przeanalizować obecną sytuację w centrum danych, ale także uwzględnić rozwój posiadanej infrastruktury. Pod uwagę trzeba wziąć prawdopodobieństwo otwierania kolejnych biur (i konieczność przyłączenia ich do infrastruktury), wzrost zapotrzebowania na wydajność i rodzaj aplikacji, które mogą być wdrażane.

Krzysztof Jakubik