System RAID

System RAID

 

Odzyskujemy dane ze wszystkich typów konfiguracji systemów RAID, niezależnie od pojemności i producenta podzespołów.

 

Studium przypadków:

Odzyskiwanie danych spowodowane uszkodzeniem kilku dysków

W zależności od rodzaju wybranego systemu, możliwe jest jego poprawne funkcjonowanie nawet po uszkodzeniu jednego lub dwóch nośników. Przykładowo, system RAID5 działa poprawnie gdy awarii ulegnie jeden dysk, a system RAID6 może ponieść stratę nawet dwóch dysków. Wówczas pojawia się stan krytyczny, jednak cały czas mamy dostęp do naszych danych. Uszkodzone dyski powinny zostać wymienione na nowe tak szybko jak to tylko możliwe. Zdarza się, że monitoring który powinien wysyłać informację o awarii na e-mail jest niepoprawnie skonfigurowany. W takiej sytuacji dowiemy się o usterce dopiero wtedy gdy już będzie za późno na samodzielne odzyskanie dostępu do danych. Nasze laboratorium chętnie pomoże w odzyskaniu danych przypadku gdy uszkodzeniu uległo więcej dysków niż dozwala zastosowany system.

Utrata danych po nieudanej przebudowie

Kiedy jeden z dysków ulega awarii i jest zastępowany nowym, kontroler RAID przelicza jego zawartość bazując na danych umieszczonych na pozostałych dyskach. Kontroler odczytuje zawartość wszystkich sektorów na wszystkich dyskach w systemie, a prawdopodobieństwo napotkania uszkodzonego sektora na jednym z tych nośników jest bardzo duże. W momencie gdy kontroler rozpozna uszkodzony sektor, odłącza dysk na którym się on znajduje. Dostęp do danych jest w tym momencie niemożliwy i wymagana jest pomoc specjalistów.

Kontroler i oprogramowanie RAID

Kontroler działa jak niewielki komputer i koordynuje przypływ wielu megabajtów danych. Każdy system jest bardzo podatny na błędy. Nasze doświadczenie pokazuję, że bez względu na koszt i producenta sprzętu, błędy systemu występują zawsze, kwestia tylko kiedy. Potwierdzeniem tego są tak popularne aktualizacje oprogramowania. W przypadku aktualizacji Firmware'u, zalecane jest aby wcześniej zrobić back up. Czasami aktualizacja zmienia algorytm przechowywania danych w systemie. Rezultatem tego jest trwała utrata danych.

Wsparcie techniczne producenta

Więksi producenci tworzą infolinie do pomocy technicznej. Obsługa takich centrów zazwyczaj nie przechodzi szkolenia technicznego, a posiada jedynie katalog przygotowanych pytań i dopasowanych odpowiedzi. Kiedy pracownik uzna że rozpoznał problem klienta, po prostu czyta gotową odpowiedź z książki. Takie zachowanie często prowadzi do fatalnych konsekwencji. Przykład: oddział wsparcia technicznego producenta rutynowo zaleca klientom, którzy doświadczyli problemów z systemem RAID aby usunęli konfigurację i stworzyli ją na nowo. Po wykonaniu takiej czynności system będzie działał poprawnie. Problem w tym, że dane zostaną skasowane.

Brak dostępu do systemu RAID

Chociaż uszkodzenia mechaniczne zdarzają się częściej, występują również uszkodzenia oprogramowania. Zwykle jest to spowodowane tym, że kilka wirtualnych serwerów jest uruchomionych równocześnie na jednym systemie RAID. Szanse i konsekwencję awarii są zwykle większe niż można by się spodziewać.

Modyfikacje poziomu systemu RAID

Kolejnym niebezpieczeństwem awarii są zmiany konfiguracji systemu. Przykładowo system może być zmieniony z RAID5 na RAID6 lub zostaje zainstalowany dodatkowy nośnik w celu zwiększenia pojemności. Te procesy są niesamowicie wrażliwe, a problemy dość często towarzyszą takim operacjom. Nawet najmniejszy błąd w oprogramowaniu lub nośnikach może skutkować utraceniem funkcjonalności systemu. Radzimy wykonywanie takich czynności po wcześniejszym zrobieniu i sprawdzeniu back up'u.

Uszkodzony RAID

Zaletą systemów RAID jest to, że jeden lub więcej nośników może ulec awarii bez straty danych. System RAID5 może działać bez jednego dysku, a system RAID6 działa poprawnie nawet przy dwóch uszkodzonych dyskach. Tak jak pisaliśmy wcześniej, te uszkodzenia mogą przejść niezauważone, gdy zawiedzie system monitoringu lub system nie zostanie naprawiony poprawnie. System funkcjonuje poprawnie dopóki nie zostanie uszkodzony o jeden dysk więcej niż dozwala konfiguracja. Należy przyjąć jako zasadę, że uszkodzony dysk należy wymienić na nowy najszybciej jak to możliwe. Trzeba zauważyć, że tutaj pojawia się źródło kolejnego problemu. W celu przeprowadzenia przebudowania oraz aby możliwe było przeliczenie nowo zaimplementowanego dysku system RAID musi mieć dostęp do wszystkich dysków i wszystkich sektorów znajdujących się na tych dyskach. Kiedy pojawi się choćby najmniejszy błąd, proces zostanie przerwany a dysk z niesprawnymi sektorami zostanie odłączony. W efekcie nie zobaczymy naszych danych

Uszkodzona seria

Czasem dyski tego samego producenta oraz tej samej serii produkcji są instalowane w systemie RAID. W takim wypadku, system będzie bardzo podatny na uszkodzenia dotyczące całej serii produkowanych dysków. Kiedy jeden z nośników ulegnie awarii, można się spodziewać że w niedługim odstępie czasu kolejny również przestanie działać poprawnie.

Utrata danych i niewystarczająca wiedza

Następnym przypadkiem jest majsterkowanie z ustawieniami kontrolera lub oprogramowaniem Firmware. W gorszych przypadkach, niepoprawnie skonfigurowany system może doprowadzić do fizycznej utraty danych, np. gdy kolejne sektory zostaną nadpisane. W tym wypadku nigdy nie uda się całkowicie odzyskać danych. Zalecamy aby nie przeprowadzać eksperymentów na własną rękę, a zamiast tego skonsultować się ze specjalistą który zajmuję się systemami RAID każdego dnia.

Inne przyczyny

Kiedy system RAID jest wyłączony przez dłuższy okres czasu, możliwe jest że serwer nie będzie się więcej uruchamiał. Przyczyną mogą być uszkodzenia serii lub błędy Firmware'u zainstalowanych dysków.

 

Zadzwoń - 693 125 531