Antworten

[ReadyNAS Wissen] Einführung in das Thema RAID

EskenderNG
NETGEAR Employee

[ReadyNAS Wissen] Einführung in das Thema RAID

Da im Forum oft Fragen zum Thema RAID auftauchen will ich hier das grundlegende Konzept zusammenfassen. Es geht hierbei nicht so sehr um eine tiefgehende Beschreibung der Technik. Da leistet ein ordentliches Buch oder auch das Internet mehr. Vielmehr steht hier das Wissen, welches Bezug zum normalen Umgang mit der ReadyNAS hat, im Vordergrund. Fortführende Beschreibungen von Flex-RAID, X-RAID 2, Plattenaustausch, etc. kommen demnächst in weiteren Artikeln.

Was bedeutet die Abkürzung RAID?
Die ursprüngliche Bedeutung „Redundant Array of Inexpensive Discs“ wurde später neu gedeutet in „Redundant Array of Independent Discs“. Es bedeutet sinngemäß die Erhöhung der Redundanz durch den Verbund von Festplatten.
Was ist Redundanz?
Ein System bestehend aus einer Anzahl von Komponenten ist redundant, wenn es den Ausfall einer einzelnen, beliebigen Komponente verkraften kann. Beispiel: Die Redundanz bei einem viermotorigen Flugzeug ist bezogen auf den Ausfall eines Triebwerks gegeben, da es auch mit drei Triebwerken fliegen kann.
Was bedeutet Verbund von Festplatten?
Dies ist das grundlegende Konzept von RAID: Alle Festplatten in der ReadyNAS werden zu einer virtuellen Festplatte verbunden. Virtuell bedeutet für den User sieht es so aus, als wäre nur eine einzige große Platte vorhanden. Er/Sie muss sich nicht darum kümmern, wie die Daten auf die verschiedenen real existierenden Festplatten verteilt werden. Dies macht der RAID-Controller oder eine spezielle Software.
Je nachdem wie die Daten auf die verschiedenen Festplatten in dem Verbund verteilt werden ergeben sich ein oder mehrere der folgenden Vor- und Nachteile:
Welche möglichen Vorteile birgt der Verbund von Festplatten?
  • Mehrere kleine Festplatten erscheinen für den User wie eine einzelne große Festplatte

  • Erhöhung des Datentransfers durch parallele Lese-, Schreibvorgänge auf verschiedenen Festplatten

  • Erhöhung der Redundanz durch das Speichern identischer Datensätze oder Prüfsummen auf verschiedenen Festplatten

Welche möglichen Nachteile birgt der Verbund von Festplatten?
  • Die Gesamtkapazität der virtuellen Festplatte kann kleiner sein als die Summe der Speicherkapazitäten der einzelnen Festplatten.

  • Zu jedem Schreibvorgang können weitere RAID-bedingte Schreibvorgänge anfallen, die zu langsamerer Schreibleistung und auf lange Sicht zu einer zusätzlichen Belastung der Festplatten führen.

  • Es kann zu einer erhöhten Ausfallwahrscheinlichkeit kommen

  • Bei Verwendung von Festplatten unterschiedlicher Größe bleibt die Speicherkapazität der größeren Festplatten teilweise ungenutzt

Scheinbar widersprechen sich hier einige Vor- und Nachteile. Das liegt daran, dass unterschiedliche RAID-Level Stärken und Schwächen in unterschiedlichen Bereichen haben.
Was bedeutet RAID-Level?
Wie erwähnt gibt es verschiedene Möglichkeiten die anfallenden Daten auf die verschiedenen Festplatten zu verteilen. RAID-Level sind derartige unterschiedliche Organisationsformen. Die wichtigsten werden folgend beschrieben.
JBOD:
JBOD steht für „just a bunch of discs“. Hier geht es alleinig darum mehrere Festplatten zu einer einzigen großen virtuellen Festplatte zusammenzuschließen. Auf Redundanz und Leistungsgewinne wird verzichtet.
RAID-Level 0:
Hier wird ein zu schreibender Datenblock gesplittet und die einzelnen Teile werden auf alle verfügbaren Festplatten verteilt geschrieben. Hierbei geht es nur um einen Leistungsvorteil durch die Parallelisierung der Arbeit. Wenn der Datenblock wieder angefragt wird können die Festplatten parallel anfangen nach Teilen des Datenblocks zu suchen und Daten zu liefern. Es gibt also einen Leistungsgewinn, sowohl beim Schreiben als auch beim Lesen. Der große Nachteil liegt auf der Hand. Fällt eine Festplatte aus, so fehlen die Teile des Datenblocks, die auf diese Festplatte geschrieben wurden. Soll heißen, fällt eine Festplatte aus, sind alle Daten verloren! Je mehr Festplatten im Verbund, desto höher die Geschwindigkeit, aber desto höher auch die Ausfallwahrscheinlichkeit. Außerdem ist der Leistungsgewinn nur dann gegeben wenn die Datenblöcke groß genug sind.
RAID-Level 1:
Dies ist eigentlich das erste echte RAID-System, da bei RAID 0 keine Redundanz erreicht wurde. RAID-Level 1 findet typischerweise, aber nicht ausschließlich, beim Vorhandensein von zwei Festplatten Verwendung. Hier werden die Daten doppelt geschrieben, und zwar identisch auf beide Festplatten. Betrachtet man die Schreibleistung erreicht man dadurch kaum Vorteile, beim Lesen bietet sich hingegen wieder paralleles Arbeiten der beiden Festplatten mit entsprechendem Leistungsgewinn an. Die Fehlertoleranz ist hervorragend. Fällt eine Festplatte aus, so wird einfach die Kopie auf der verbleibenden Festplatte benutzt. Auch das darauf folgende Wiederherstellen der Daten ist ein einfaches Kopieren der kompletten Festplatte auf eine neue. Der größte Nachteil ist der Preis. 50% der gekauften Festplattenkapazität ist nicht nutzbar, da sie für die Kopien der Daten benötigt wird. Sind die Festplatten unterschiedlich groß geht noch mehr Speicherplatz verloren. Der Speicherplatz der größeren, der über den der kleineren hinausgeht, kann nicht genutzt werden.
RAID-Level 5:
Ausgangslage ist wieder RAID-Level 0, soll heißen, ein Datenblock wird gesplittet und die einzelnen Teile werden über die Festplatten verteilt. Dieses Mal jedoch mit Ausnahme einer Festplatte. Auf dieser wird eine Prüfsumme gespeichert. Aus der Prüfsumme lässt sich der gesamte Datenblock auch dann rekonstruieren, wenn maximal ein Teil dieses Datenblocks durch einen Festplattenausfall nicht mehr zur Verfügung steht. Tatsächlich verwendet man nicht immer die gleiche Festplatte für die Prüfsumme, sondern für jeden Datenblock eine andere. Dies geschieht um die Festplattenbelastung gleichmäßig zu verteilen. Eine einzige Festplatte für Prüfsummen wäre die mit Abstand belastetste im ganzen System. Dieses RAID-System vereint teilweise die Vorteile von RAID 0 und RAID 1. Auf der einen Seite ist ein Leistungsgewinn beim Lesen zu verzeichnen und auf der anderen Seite ist Redundanz gegenüber dem Ausfall einer Festplatte gegeben. Ein Nachteil des Systems ist der zusätzlich anfallende Lese- und Schreibaufwand für die Berechnung der Prüfsummen beim Schreiben von Daten und die hohe Komplexität im Fall der Datenwiederherstellung. RAID-Level 5 ist für den Normalgebrauch das zu bevorzugende System.
RAID-Level 6:
Ohne die Details zu benennen verkraftet RAID-Level 6 den gleichzeitigen Ausfall von zwei Festplatten. Die ReadyNAS muss mindestens mit vier Festplatten bestückt sein um RAID-Level 6 zu verwenden. Die Schreibgeschwindigkeit ist sehr hoch. Allerdings müssen bei Verwendung dieses Systems Vorsichtsmaßnahmen gegen plötzlichen Spannungsabfall getroffen werden.
Neben den erwähnten gibt es noch weitere RAID-Level.
Ersetzt die Verwendung von RAID ein Daten-Backup?
Manche können die Antwort wahrscheinlich nicht mehr hören. Nein, RAID ersetzt kein Backup! Einfaches Beispiel ist die versehentlich gelöschte Datei. Diese ist auch bei Verwendung von RAID auf allen Platten gelöscht. Weitere Beispiele sind noch der Stromausfall im Moment der Berechnung von Prüfsummen (gilt z.B. für RAID 6, das hier allerdings nicht besprochen wurde). Man darf auch nicht vergessen, dass das Wiederherstellen von Daten gerade bei den höheren RAID-Level enormen Stress für die Festplatten bedeutet. Und das zu einem Zeitpunkt an dem die Redundanz durch den Ausfall der ersten Festplatte verloren gegangen ist.
Warum dann überhaupt RAID verwenden?
Die Vorteile von RAID, wie Geschwindigkeitsvorteil, große virtuelle Festplatte, etc. wurden weiter oben besprochen. Und auch wenn die Redundanz nicht ein Backup ersetzt, so hat sie dennoch einen großen Wert: Einfachheit der Handhabung und hohe Verfügbarkeit der Daten. Fällt eine Festplatte aus, müssen nicht mühsam alle Daten kopiert werden. Die kaputte Festplatte wird einfach ausgetauscht und der RAID-Verbund tut selbstständig im Hintergrund das nötige, um die neue Festplatte zu integrieren. Der User kann derweil normal weiter arbeiten.

Wie gesagt, dies ist nur eine oberflächliche Einführung. Diese Informationen findet man natürlich auch an jeder Ecke im Internet. Ich habe mich jedoch bemüht die Sachverhalte in einfachen Worten zu beschreiben. Ich hoffe jemand findet Interesse daran. Verbesserungs- und Erweiterungsvorschläge oder Fehlerkorrekturen gerne hier posten!

Gruß,
Eskender
Nachricht 1 von 1
Diskussionsstatistiken
  • 0 Antworten
  • 2320 Aufrufe
  • 0 Kudos
  • 1 in Unterhaltung