Virtuelle Systeme lösen zunehmend klassische physikalische Server ab. Durch entsprechende Software wird quasi ein Computer im eigentlichen PC nachgebildet. Diese virtuelle Maschine funktioniert wie ein eigenständiger Rechner. Vor allem Unternehmen greifen im Zuge steigender Rechenleistungen und Datenvolumina gern auf virtualisierte Serversysteme zurück. Aufgrund der wachsenden Verbreitung von Virtualisierungen steigt auch die Zahl der Datenverluste in diesem Bereich. Im Folgenden erläutern wir, welche Ursachen ein Datencrash haben kann und mit welchen Herausforderungen Spezialisten bei der Datenwiederherstellung konfrontiert werden. Zudem geben wir Tipps, wie sich das Fehlerrisiko in virtuellen Umgebungen minimieren lässt.
Was sind virtuelle Systeme und welche Anbieter gibt es?
Die Nachbildung eines Rechnersystems wird als virtuelle Maschine bzw. System bezeichnet. Dabei wird die Rechnerarchitektur eines real existierenden oder eines hypothetischen Computers nachgestellt. Zwischen dem tatsächlichen Rechner und der virtuellen Maschine befindet sich der Hypervisor. Dieser ermöglicht es, dass eine oder mehrere virtuelle Systeme (sogenannte Gastsysteme) simultan auf einem Computer, der als Hostsystem dient, betrieben werden können. Zudem übernimmt der Hypervisor die Verwaltung der Ressourcenzuteilung für die verschiedenen Gastsysteme.
Ein prominenter Anbieter von Virtualisierungslösungen ist beispielsweise vmWare. Oft genutzt werden ESX- oder vmWare-Server und die vmWare-Workstation. Ebenso beliebt bei Firmen ist Hyper-V, die Hypervisor-basierte Virtualisierungstechnik aus dem Hause Microsoft. Des Weiteren sind virtuelle Systeme von Citrix (z. B. XENServer) und von Oracle (z. B. VM VirtualBox) erhältlich. In Linux ist eine Virtualisierung mittels KVM (Kernel-based Virtual Machine) realisierbar.
Warum setzen Unternehmen auf virtuelle Umgebungen?
Virtuelle Maschinen wurden ursprünglich entwickelt, um mehrere Betriebssysteme auf einem PC installieren zu können. Dadurch lassen sich die vorhandenen Ressourcen wie etwa die Prozessorleistung effizienter nutzen. Darüber hinaus können Betriebssysteme von verschiedenen Herstellern (beispielsweise Windows und Linux) gleichzeitig genutzt werden.
Hauptsächlich größere Unternehmen, in deren Rechenzentren viele Systeme parallel laufen müssen, setzen auf Virtualisierung. Das hat den Vorteil, dass nicht für jedes Betriebssystem eine eigene Hardware – also ein Computer inklusive Zubehör – angeschafft werden muss. Der Betrieb einer leistungsstarken Plattform ist wirtschaftlicher als der Einsatz zahlreicher kleiner Plattformen, die insgesamt die gleiche Performance erbringen. Mit virtuellen Umgebungen lassen sich folglich die Investitions- und Betriebskosten der IT-Abteilung bei gleichzeitiger Effizienzsteigerung senken. Eine Virtualisierung vereinfacht außerdem die Verwaltung und die Verwendung von IT-Komponenten, weil Workloads schneller bereitgestellt und Betriebsabläufe automatisiert werden.
Virtuelle Systeme sind an sich sehr gut gesichert. Sie sind streng vom Betriebssystem, auf dem sie laufen, abgekapselt. Befällt ein Trojaner die virtuelle Umgebung, gelangt er nicht einfach auf das Hostsystem. Allerdings ist es chinesischen Hackern im Rahmen eines Wettbewerbes schon gelungen, von einer virtuellen Maschine aus das Wirtssystem zu kapern. Betroffen war eine vmWare-Workstation, die hauptsächlich für Privatanwender und kleinere Firmen konzipiert ist. Die für den professionellen Einsatz in größeren Unternehmen gedachte Variante ESXi konnten die Hacker nicht knacken.
Wodurch kann es bei virtuellen Maschinen zu Datenverlusten kommen?
Fehlerquelle Nummer 1 bei virtuellen Maschinen sind die Anwender selbst. Die Einrichtung und Verwaltung einer Virtualisierung erfordert umfangreiche Kompetenzen. Nicht selten erleben Datenretter, dass virtuelle Festplatten irrtümlich gelöscht oder formatiert wurden. Mitunter genügt dafür ein falscher Mausklick. Gerade wenn mehrere Gastsysteme angelegt wurden und diese eine falsche oder uneindeutige Bezeichnung erhalten, kann das vorkommen.
Auch das unbeabsichtigte Überschreiben von Daten und die Beschädigung von Metadateien stellen ein Datenrisiko dar. Ein Crash im virtuellen System kann ebenfalls auftreten, wenn technische Details wie die LUN (eindeutige Kennnummer einer Festplatte oder eines Disk-Verbundes) oder Snapshots (Momentaufnahmen von Datenblöcken der virtuellen Platte) versehentlich entfernt oder überschrieben wurden.
Eine weitere Gefahr bildet ein Hardwareausfall. Auf der untersten Ebene des virtuellen Servers wird meist ein RAID-Array, d. h. ein Verbund aus mehreren Datenträgern, verwendet. Durch die redundante Speicherung der Daten kommt es hier zwar nicht so schnell zu einem Verlust. Allerdings ist es möglich, dass eine oder mehrere Disks versagen, sodass das virtuelle RAID schließlich inkonsistent ist. Ebenso kann ein kaputter Controller dafür sorgen, dass die virtuelle Maschine nicht mehr verfügbar ist.
Darüber hinaus können Schäden im Hostdateisystem, die oft auf defekte Sektoren zurückzuführen sind, einen Datencrash auslösen. Mitunter sind deshalb die Verzeichnisstrukturen fehlerhaft oder unvollständig. In schwerwiegenden Fällen ist ein Hochfahren des Hostsystems gar nicht mehr möglich. Ist das Hostdateisystem beschädigt, wird womöglich gleichfalls das Gastsystem in Mitleidenschaft gezogen. Beispielsweise kann ein Stromausfall einen Datenverlust verursachen. Ist nämlich keine unterbrechungsfreie Stromversorgung (USV) vorhanden, werden die Systeme unvermittelt heruntergefahren.
Wie kann man einem Datencrash vorbeugen und was ist im Notfall zu beachten?
Damit der Worst Case möglichst gar nicht erst eintritt, lassen sich einige präventive Maßnahmen ergreifen. So steigert der Einsatz von Hochverfügbarkeitsclustern nicht nur die Performance, sondern auch die Ausfallsicherheit. Vorsorgen kann man ebenso, indem man den virtuellen Server, die LUNs und RAID-Konfigurationen sowie die Betriebs- und Dateisysteme vollständig dokumentiert. Dadurch lassen sich administrative Fehler vermeiden. Und im Ernstfall erleichtert die Dokumentation eine Datenwiederherstellung. Außerdem sollte das System möglichst gut gesichert sein. Dazu gehört es, regelmäßig ein Backup anzulegen und dieses auf seine Verfügbarkeit sowie die Vollständigkeit des Inhalts zu kontrollieren.
Bei einem Datenverlust ist ein besonnenes Vorgehen dringend erforderlich. Wurde der virtuelle Server gelöscht, sollte zunächst das gesamte Hostsystem ausgeschaltet werden. Das ist sinnvoll, um weitere Schreibvorgänge im virtuellen Filesystem zu unterbinden. Ansonsten kann es passieren, dass die fragmentierten bzw. verlorenen Daten teilweise oder komplett überschrieben und somit irreversibel gelöscht werden. Ein Herunterfahren des Servers ist ebenso ratsam, falls Beschädigungen am Dateisystem aufgetreten sind. Vorsicht sollte man bei einem RAID-Rebuild walten lassen. Häufig hat bereits eine Festplatte unbemerkt den Dienst quittiert, bevor das gesamte System zusammenbricht. Wird nun das RAID-Array fehlerhaft reorganisiert, kann es zu einem Totalverlust aller Daten kommen.
Daten aus virtuellen Umgebungen zu retten, ist kein leichtes Unterfangen. In der Regel müssen erfahrene Spezialisten hinzugezogen werden. Denn bereits geringfügige Eingriffe können fatale Auswirkungen auf die Virtualisierungsebenen haben. Wie geschildert wurde, gibt es eine große Bandbreite an möglichen Ursachen für Crashs von virtuellen Servern. Deshalb ist es zunächst von Bedeutung, den Grund für einen Datenverlust zu ermitteln. Anschließend kann eine geeignete Recovery-Methode ausgewählt werden. Liegen beispielsweise logische Schäden vor, muss meist ein spezielles Verfahren entwickelt werden, um eine konsistente Datenwiederherstellung zu gewährleisten. Im Fall eines defekten RAID-Verbundes ist bei der Datenrekonstruktion die höchstmögliche Qualität anzustreben. Nur so lassen sich Beschädigungen im virtuellen System beheben.
Die Datenrettung virtueller Systeme ist seit 1991 eines unserer Spezialgebiete. Selbst bei schweren Schäden können unsere kompetenten Fachkräfte virtuelle Disks, Snapshots und Systeme wiederherstellen. Dafür steht neben Reinraumlabor und -arbeitsplätzen auch eine unternehmenseigene Forschungsabteilung zur Verfügung. Auf Wunsch führen wir die Diagnose und Datenrekonstruktion in Expressgeschwindigkeit durch.