Arbeitsweise eines RAID - Einführung

Arbeitsweise, Probleme und Anforderungen eines Raid 5 im Vergleich zu Raid Varianten

Eine Information der Attingo Datenrettung GmbH

Die Abkürzung RAID stammt aus dem Englischen und steht für: redundant array of independent disks (zu deutsch: redundante Anordnung unabhängiger Festplatten). Diese Technologie soll die Ausfallsicherheit von Festplatten ebenso erhöhen wie deren Leistungsfähigkeit. Dabei ist die RAID-Technologie nicht nur für große Unternehmen mit entsprechendem Traffic lohnenswert sondern auch für den einzelnen Desktop-Anwender. Obwohl es viele verschiedene Varianten der RAID-Technologie gibt, konzentriert sich der nachfolgende Artikel hauptsächlich auf RAID 5 und seine Vor- und Nachteile gegenüber den Versionen 0 bis 4.

1987 erblickte RAID an der Universität von Kalifornien in Berkeley das Licht der Welt. Zu der Zeit war die Speicherung großer Datenmengen jedoch noch recht kompliziert. Zwar boten die damals in den Rechenzentren gebräuchlichen SLEDs (kurz für Single Large Expensive Disks), welche im 14-Zoll-Format erhältlich waren, eine Menge Speicherplatz (durchschnittlich 2 bis 3 GB) und die Daten waren sicher, aber sie waren vergleichsweise sehr teuer. Als günstigere Alternative für die Massenspeicherung boten sich die wesentlich kleineren und in Relation zur Speicherkapazität billigeren Drives im Format von 5,25 Zoll an.
Doch diese Technologie war noch sehr neu und so warf ihre Verwendung noch das ein oder andere Problem auf.


  1. Die Speicherung von Daten auf vielen kleinen Laufwerken statt eines einzelnen großen könnte zu Verwaltungsproblemen führen. Organisierte man die Platten als JBOD („just a bunch of disks“ – Ein Bündel unabhängiger Disks), so würde das Auffinden von freiem Speicherplatz sowie einmal abgespeicherter Dateien einer Suche nach der Nadel im Heuhaufen gleichen.
  2. Die kleinen HDDs sind weit weniger zuverlässig als die großen SLEDs.
  3. Die statistische Wahrscheinlichkeit, dass wichtige Daten verloren gehen, steigt bei der Speicherung auf mehreren Drives zusätzlich an.

Die Lösung für diese Probleme lieferten die drei Doktoranden von Berkeley, David Patterson, Garth Gibson und Randy Katz, als sie mehrere kleine Laufwerke zu einem ausfallgesicherten Verbund kombinierten, der mit Fehlererkennungs- und Fehlerkorrekturmechanismen ausgestattet ist. Im Juni 1988 veröffentlichten sie eine Studie mit dem Namen: „A Case for Redundant Arrays of Inexpensive Disks (RAID)“: die Geburtsstunde von RAID.


Die Anforderungen an die Festplatten

Es ist noch gar nicht allzu lange her, da waren die Anforderungen, die die RAID-Controller an die verwendeten Festplatten stellten immens hoch, was den Spielraum deutlich einschränkte. SCSI war Pflicht als Interface und alle verwendeten Platten mussten komplett identische Kapazitäten aufweisen. Häufig war es auch so, dass sich ausschließlich Platten derselben Baureihe für den Verbund verwenden ließen.

Heute sind die Einschränkungen allerdings weniger streng. Zwar wird im klassischen Serverbetrieb nachwievor SCSI bzw. sein serieller Nachfolger SAS verwendet. Aber im Entry-Level-Server oder der Workstation kann der Anwender auch getrost auf die wesentlich günstigeren SATA-HBA zurückgreifen. Zudem sind in Desktop-PCs SATA-Controller inzwischen ebenfalls zum Standard geworden.

Moderne Controller aber auch Software-RAID-Lösungen bieten heutzutage auch die Zusammenstellung von Festplatten mit unterschiedlicher Kapazität im Verbund an. Allerdings kann man dabei nicht die gesamte Netto-Kapazität für das Array verwenden. Hierbei wird jedes Laufwerk nur bis zur Kapazität der kleinsten verwendeten Festplatte genutzt, was an der immer noch existierenden Voraussetzung von gleich großen Platten für das RAID-Verfahren liegt. Verwendet man nun eine Kombination aus einer 250-GByte-Festplatte und zwei 360-GByte-Disks stehen also nur dreimal 250 GByte bereit.



Datenrettung - Interne Festplatte, Brandschaden
Bild:
Interne Festplatte, Brandschaden.


RAID 5 – Was ist anders zu den Varianten Raid 0 bis Raid 4?

Im Gegensatz zu RAID 5 handelt es sich bei RAID Level 0 nicht um ein redundantes Speicherverfahren. Die Hauptfunktion von RAID 0 liegt in der Beschleunigung der Plattenzugriffe, was aber zu Lasten der Datensicherheit geht: Fällt hier auch nur eine Platte aus, sind sämtliche Daten verloren.

RAID 1 hingegen bietet eine top Datensicherheit, da in diesem Verfahren das sogenannte Mirroring bzw. die Spiegelung zum Einsatz kommt. Anders als bei RAID 5 erfolgen hier sämtliche Schreibzugriffe parallel auf 2 Festplatten, sodass jede der Platten gleichzeitig ein Spiegelbild der anderen ist. Dank dieses Verfahrens sind die Daten doppelt vorhanden, sodass beim kompletten Ausfall einer der beiden Festplatte kein Verlust entsteht. Der große Nachteil an RAID 1 gegenüber RAID 5 ist allerdings, dass nur die Hälfte der gesamten Speicherkapazität für die Datenspeicherung genutzt werden kann, was die Kosten für die Haltung der Daten quasi verdoppelt.



Datenrettung - Festplatte Analyse Reinraum
Bild:
Festplatte Analyse Reinraum

Noch besser gegen Fehler geschützt ist man mit RAID 2. Da es aber vergleichsweise aufwändig zu implementieren ist, wird es heute kaum nich genutzt und blieb bis auf wenige Anwendungen dem Großrechnerbereich vorbehalten. Anders als RAID 5 nutzt RAID 2 eine bitweise Aufteilung der Nutzdaten. Dabei erkennt RAID 2 zwar jeden Fehler, aber von welcher Festplatte dieser stammt, kann nicht nachvollzogen werden. Zudem erzwingt RAID 2 durch seine bitweise Verteilung auf eigene Laufwerke mindestens 10 Festplatten im Verbund, was RAID 2 gerade für Privatanwender ungeeignet erscheinen lässt.

Während sich RAID 5 auch für kleinere Dateien eignet, ist RAID 3 eher für große Dateien konzipiert worden, da es erst dort sein volles Leistungspotenzial unter Beweis stellen kann. Als Sicherheitsmechanismus setzt RAID 3 anders als RAID 2 und 5 auf die integrierten Funktionen der Festplatten und braucht deshalb nur ein einzelnes Parity-Laufwerk. RAID 3 synchronisiert die Leseköpfe der im Verbund integrierten Festplatten, was zwar Schreibzugriffe ohne Overhead ermöglicht, jedoch gerade beim Lesen kleinerer Dateien viel Zeit kostet, da jedesmal die Köpfe neu ausgerichtet werden.

In den meisten seiner Funktionen entspricht RAID 4 dem RAID Level 3. Allerdings nutzt es anders als die Level 3 und 5 das blockweise Striping und es verzichtet auf die Synchronisation der Leseköpfe, was RAID 4 vor allem beim Lesen kleiner Dateien Vorteile bringt. Anders als RAID 5 nutzt es zur Speicherung der Parity-Informationen ebenso wie seine Vorgänger ein dediziertes Laufwerk. Wegen seiner Arbeitsweise und der komplizierten Handhabung der ECC-Updates eignet sich RAID 4 anders als RAID 5 für Arbeitsumgebungen, in denen die Lesezugriffe die Schreibzugriffe bei weitem überwiegen. RAID 4 kommt vergleichsweise selten zum Einsatz, da seine Vorteile gegenüber RAID Level 3 eher minimal sind.


RAID 5 – Vor- und Nachteile

Dass RAID 5 wohl die beliebteste RAID-Variante ist, liegt sicherlich am gesteigerten Datendurchsatz beim Lesen der Daten sowie der Leistungsfähigkeit im Vergleich zu den relativ niedrigen Kosten. Das liegt daran, dass der Datendurchsatz aufgrund eines zweiphasigen Schreibverfahrens erheblich abnimmt. Als Vorteil wäre hingegen zu werten, dass RAID 5 eine der kostengünstigsten Möglichkeiten ist, Daten redundant auf mehreren Festplatten zu speichern und deren Speichervolumen möglichst effizient auszureizen.

RAID 5 arbeitet mit einer blockweisen Verteilung der Nutzdaten, verzichtet jedoch im Gegensatz zu RAID Level 4 auf ein dediziertes Parity-Laufwerk. Dadurch verteilt RAID 5 die ECC-Daten mit den Nutzdaten zusammen gleichmäßig auf alle Laufwerke im Verbund. Durch das Fehlen des Parity-Laufwerkes sinkt die Wahrscheinlichkeit, dass auf einer Festplatte gleichzeitig zwei Schreibzugriffe stattfinden. Zugleich gibt es auch eine gleichmäßige Verteilung der mechanischen Belastung der HDDs, denn schließlich nimmt keine die Sonderstellung als Parity-Laufwerk ein.

Die Sicherheit der Daten des Arrays ist bei RAID 5 beim Ausfall von maximal einer Festplatte garantiert. Fällt eine Festplatte aus oder befindet sich das System im Rebuild auf die Hotspare-Platte, lässt die Leistung spürbar nach; dieser Leistungsschwund ist auch nach dem Austausch einer defekten Festplatte vorhanden. Es gibt allerdings Methoden, die die Rebuild-Leistung verbessern und die Ausfallsicherheit erhöhen sollen wie das präventive RAID 5. Bei diesem Verfahren werden interne Fehlerkorrekturstatistiken der Festplatten herangezogen, die eine Vorhersage des Ausfalls der Festplatten vornehmen. Nun wird die Hot-Spare-Festplatte vorsorglich mit sämtlichen Daten der Festplatte synchronisiert, welche im Verbund als die ausfallsverdächtigste diagnostiziert wurde. Tritt der vorhergesagte Versagenszeitpunkt schließlich ein, tritt die Hot-Spare-Platte sofort an deren Stelle. Allerdings wirkt sich der hohe Aufwand, den das präventive RAID 5 mit sich bringt, nachteilig aus, weshalb es derzeit nur in wenigen Hochleistungs-Speichersystemen implementiert wurde.


Literatur und Links zum Thema:


  • Patterson, Gibson, Katz: A Case for Redundant Arrays of Inexpensive Disks (RAID); 1988; University of Berkeley, California
  • Pinheiro, Weber, Barroso: Failure Trends in a Large Disk Drive Population; 2007; Mountain View, California

Der Autor ist freier journalistischer Mitarbeiter bei Attingo Datenrettung GmbH.


Quellen und Verweise:




Ablauf und Preise

Attingo bietet Datenrettung für jede Dringlichkeitsstufe: Economy, Business, High Priority

Versandzeiten

Abholen und Versenden von Datenträgern in Österreich, Deutschland und den Niederlanden aus Ihrer Stadt.

Richtig verpacken

Eine optimale Datenrettung beginnt mit der professionellen Verpackung der Festplatten.

Raid-Systeme

Attingo ist spezialisiert auf Raid-Datenrettung, sowie Server-Datenrettung

Ursachen und Lösungen
Partnerprogramm

Wir retten die Daten Ihrer Kunden professionell.

mehr
Server & Raid

Wir retten alle physikalisch vorhandenen Daten für Sie.

mehr
Diagnoseanfrage

Direkt online ausfüllen.

mehr