| « Nintoaster - Nintendo in einem Toaster | DVDs abspielen unter Linux » |
Smarte Festplatte-Informationen
Aktuelle Festplatten bieten ein Diagnosesystem für Festplatten (S.M.A.R.T. - Self-Monitoring, Analysis and Reporting Technology). Dieses kann wertvolle Hinweise über den Zustand der Festplatte liefern. Da nahezu jedes aktuelle BIOS S.M.A.R.T. unterstützt, benötigt man nur noch eine Software, um auf das S.M.A.R.T.-System zuzugreifen.
Follow up:
Die passende Software findet man im Paket smartmontools. Alternativ kann man sie auch von der smartmontools Homepage herunterladen. Es sind ein Dämon zur dauerhaften Festplattenüberwachung (smartd) und der Befehl smartctl enthalten.
Im Folgenden soll beispielhaft die Festplatte /dev/sda betrachtet werden. Wenn eine andere Festplatte untersucht werden soll, ist die entsprechende Gerätedatei zu ersetzen. Erste Informationen, wie z.B. das Festplattenmodell und die genaue Größe Platte, erhält man durch smartctl -i /dev/sda. Des weiteren wird angezeigt, ob die Festplatte überhaupt S.M.A.R.T. unterstützt und ob S.M.A.R.T. aktiviert ist. Sollte dies nicht der Fall sein, kann man S.M.A.R.T. mit smartctl -s on /dev/sda aktivieren.
Die Detailinformationen über den aktuellen Zustand der Platte kann man mittels smartctl -A /dev/sda auslesen. Für uns interessant sind die Spalten ATTRIBUTE_NAME (Name des ausgelesenen Attributs), VALUE, WORST, THRESH, TYPE, UPDATED, WHEN_FAILED (wann der letzte Fehler aufgetreten ist) und RAW_VALUE.
Letzteres spiegelt den aktuellen Wert des ausgelesenen Attributs wider. Dieses Feld kann bei dem einen oder anderen Hesteller auch mehrere Messwerte enthalten. VALUE und WORST sind normalisierte Werte des Feldes RAW_VALUE. Bei der Normalisierung wird eine mathematische Funktion auf den RAW_VALUE angewendet, so dass das Ergebnis der Funktion immer Werte zwischen 1 (schlechtester Wert) und 254 (bester Wert) ergibt. Die Funktion ist ein Firmengeheimnis und von Hersteller zu Hersteller verschieden. Einige Hersteller verwenden bei manchen Attributen 100 anstatt 254 als maximalen Wert. VALUE stellt den aktuellen normalisierten Wert des jeweiligen Attributs dar und WORST den schlechtesten jemals errreichten normalisierten Wert.
THRESH repräsentiert den normalisierten Grenzwert für das betreffende Attribut im Bezug auf die Lebensdauer der Platte. Es gibt zwei verschiedene Typen (TYPE) von Attributen: Pre-fail und old-age. Pre-fail bedeutet, dass wenn VALUE kleiner oder gleich THRESH ist, liegt ein kritischer Fehler vor und die Platte ist eigentlich bereits hinüber (sofort alles, was auf der Platte ist sichern, sofern noch möglich). Old-age hingegen ist nicht ganz so kritisch und besagt, wenn VALUE kleiner oder gleich THRESH ist, wurde die durchschnittliche Lebensdauer einer Platte diesen Typs überschritten. Das bedeutet, dass es wahrscheinlich ist, dass es in nächster Zeit zu einem Aufall kommt. Also auch hier Daten sichern und eine neue Festplatte besorgen!
UPDATED sagt uns, ob ein bestimmtes Attribut ständig gemessen wird (always) oder ob nur bei einem Offline-Test eine Messung erfolgt (offline). Letzteren kann man mittels smartctl -t offline /dev/sda anstoßen. Anstatt "offline" kann man auch "short" oder "long" für einen kurzen oder langen Test der Platte verwenden. Das Ergebnis dieser beiden Tests kann man sich mit smartctl -l selftest /dev/sda anschauen. Es gibt noch weitere Testoptionen, die man dem Manual entnehmen kann.
Das Resultat sollte wie folgt aussehen:
Bei gebrauchten Festplatten kann man auch sehen, wie sie eingesetzt wurden und ob es sich noch lohnt, diese Platten überhaupt zu verwenden. Eine Server-Platte hat z.B. eine lange Laufzeit und vergleichsweise wengige Ein-Ausschaltvorgänge miterlebt. Von einer Platte, deren WORST-Messwerte schon nahe dem Grenzwert liegen, ist keine besonders lange Laufzeit mehr zu erwarten. Sollte dieser für eines der Pre-Fail-Attribute gar schon einmal unterschritten worden sein, liegt die Platte in ihren letzten Zügen und ist eigentlich schon hinüber.
Laut einer Studie von Google ließen sich mit Hilfe von SMART in über 56% aller Plattenausfälle diese nicht vorhersagen. Andererseits haben sich jedoch die SMART-Attribute "scan errors", "reallocation counts", "offline reallocations" und "probational counts" als starke Indikatoren für den bevorstehenden Plattenausfall herauskristallisiert.
Trackback address for this post
Trackback URL (right click and copy shortcut/link location)
