13. März 2016 , 20:33 Uhr
von Marc Eggert

Irgendwann erwischt es einen doch und eine der Festplatten im Raid-Verbund raucht ab – und in meinem Fall sogar richtig. Zum System: Ein Hetzner-Root-Server, zwei 1.5TB-Platten im Softraid1. Im Grunde läuft ein solches System auch mit einer Festplatte weiter – dazu ist ja schließlich das Raid1-System auch gedacht. Allerdings fehlt dann die gewünschte Redundanz und sobald die zweite Platte ebenfalls abraucht, ist das Desaster da. Also: Daten vom Server nochmals sichern(!) und den Festplattentausch über den Hetzner-Support anregen. Dies geschieht über den Reiter „Support“ im Hetzner-Robot des jeweiligen Servers.

Normalerweise muss man hier die Serien-Nummer, sowie den Smartmon-Bericht der defekten Festplatte mit angeben. Ist die Festplatte allerdings wie in meinem Fall schon vom System gar nicht mehr ansprechbar, geht das natürlich nicht mehr.

Auf System-Ebene sieht man, dass der Verbund nicht mehr komplett ist, in dem man das folgende Kommando eingibt:

Es wird hier beispielsweise nur noch „sda*“ angezeigt und „sdb*“ ist gar nicht mehr vorhanden. Zusätzlich zeigt der Status „[_U]“, dass der Verbund nicht komplett ist. Bei einem vollständigen Raid würde die Ausgabe „[UU]“ lauten. Falls „sdb*“ doch angezeigt wird, allerdings nicht im Verbund ist, wird diese mit einem Zusätzlichen „[F]“ in der oberen Ausgabe angezeigt.
Mit dieser Information kann nun der Auftrag erteilt werden, dass die Festplatte „sdb“ ersetzt werden soll.
Dies passiert auch recht schnell und sofern man dem Shutdown und einem eventuellen Datenverlust durch das Austauschen der defekten Platte zustimmt, passiert dies nach Angaben von Hetzner innerhalb der kommenden 4 Stunden. Mein Support-Call war Sonntag nachmittags und die Festplatte war innerhalb der darauffolgenden 15 Minuten erledigt(!).

Allerdings ist das System nicht sofort boot-fähig. Die Festplatte muss wieder in den Raid-Verbund aufgenommen und synchronisiert werden. Dazu bootet man über den Hetzner-Robot den Server in den Rescue-Mode.
Hierbei ist es wichtig, dass man die neue Festplatte auch als solche erkennt – diese wird beim Login in den Rescue-Mode mit dem Zusatz „disk contains no partition table“(o.ä.) angezeigt.
Als erstes wird dann auch die Partitionstabelle auf die neue Festplatte kopiert:

Es wird von der Festplatte sdb nach sda kopiert – dies ist ggf. anzupassen, falls die sdb-Platte die neue Festplatte ist!
Im folgenden Schritt wird die Partitionstabelle dann neu eingelesen:

Im Anschluss kann man dann die Partitionen den Raid-Arrays zuordnen. In meinem Beispiel hat das so ausgesehen:

Unter „recovery“ wird die Zeit angezeigt, die benötigt wird, um die Platte wieder vollständig im Raid zu haben. Im Rescue-Mode passiert dies schneller, als im Echtbetrieb(!). Der Server kann aber auch während dem Recovery-Prozess neu gestartet werden.
Zunächst muss aber evtl. der Boot-Sektor neu geschrieben werden.
Im Rescue-Mode kann man aber bereits die Volume-Groups mounten und über eine chroot-Umgebung auch direkt grub starten.
Dazu war in meinem Fall folgendes notwendig:
Mounten der Volumes (LVM) in das /mnt-Verzeichnis (das kann natürlich je nach eigener LVM-Konfiguration anders aussehen):

An dieser Stelle sollte nach kurzer Zeit der Server wieder laufen und man sollte sehen können, dass die Festplatte weiter gesynct wird:

Wie gesagt: Der Festplattentausch seitens Hetzner geht zackig! Beauftragt man diesen und hat alle Infos mitgesandt, kann diese Sache innerhalb weniger Minuten erledigt sein. Top!

    Zu diesem Beitrag gibt es noch keine Kommentare...

Kommentar verfassen