Wenn wir heute einen IT-Leiter fragen, wieviel Verfügbarkeit er in seinem Rechenzentrum hat, kommt oft die Antwort „100 % – Letztes Jahr ist nichts ausgefallen“.

So wird Verfügbarkeit allerdings nicht berechnet. Nicht zurückblickend, sondern in die Zukunft, i.d.R. auf die nächsten 12 Monate, projiziert und mit allen Risiken inkludiert. Daher lässt sich relativ klar sagen: 100 % Verfügbarkeit gibt es nicht. Da niemals wirlich alle Risiken ausgeschlossen werden können.

Wer allerdings seinen Server noch nicht einmal mit USV, Backup oder Clustering konfiguriert hat, ist recht weit weg von Hoch-Verfügbarkeit.

Berechnung

Wenn eine 24*7 Infrastruktur zugrunde gelegt wird, also 365*24h = 8760 Stunden pro Jahr, dann ergeben sich folgende Berechnugnen:

Verfügbarket in Prozent	Maximale Ausfallzeit
99 %	87,6 h pro Jahr
99,9 %	8,76 h pro Jahr
99,99 %	52,56 Min pro Jahr
99,999 %	5,2 Min pro Jahr

Die Berechnung ist hier gar nicht so einfach. Wikipedia z.B. berechnet nach folgender Formel:

Hier wäre aber rückwirkend der Ausfall mitberechnet. Es fehlt die Risikoberechnung.

Außerdem unterscheidet die Verfügbarkeitsberechnung zwischen geplanter und ungeplanter Downtime.

Bei einer geplanten Downtime wie z.B. für Wartungsaufgaben wird der Stillstand des Systems nicht eingerechnet.

Selbiges gilt übrigens für Cloud Anbieter. Sollte Microsoft morgen ankündigen, dass das gesamte Rechenzentrum 2 Tage ausfällt ist das kein Fall der fehlenden Hochverfügbarkeit. Aber dennoch nicht vereinbart, der der Betrieb 24*7 laufen muss, dh. es keine geplante Downtime geben darf.

Garantierte Verfügbarkeit bezieht sich also auf ungeplante Ausfälle.

Hoch-Verfügbar – High Availabiltity HA

Von hochverfügbar wird erst gesprochen, wenn die Garantierte Verfügbarkeit über 99,99 % liegt, also z.B. 99,992 %.

Fehlertolerant wird dann eine Verfügbarkeit oberhalb von 99,999 % bezeichnet.

Cold-Standby

Eine Möglichkeit zur Umsetzung von Verfügbarkeit ist ein Stand-By System. Meist ist dieses heruntergefahren, daher „Cold“. Im Falle eines Ausfalls des Produktivsystems muss dann manuell das Stand-By-System gestartet werden.

Cluster Services

Im Windows Server 2012 und höher sind bereits in der Standard Edition die Cluster Services enthalten. Zuvor musste hierfür die Enterprise Edition erworben werden. Auch die Einrichtung eines Clusters ist bedeutend einfacher geworden.

Der Interconnect, auch Heartbeat, ist dabei…..

Disaster Recovery

….

Fragen zur Verfügbarkeit

Wie hoch ist die Verfügbarkeit im eigenen Rechenzentrum?
Wie hoch ist die Wahrscheinlichkeit, Hochwasser, Bergrutsche, Bagger, Einstürze oder sonstige Risiken vorliegen zu haben?
Wie lange darf ein Dienst, wie z.B. Exchange ausfallen?
Oft ist das SAP-System als Mission Critical eingestuft, E-Mail wird manchmal noch nicht so wahrgenommen, ist aber vermutlich bei vielen Unternehmen heute sogar kritischer für die Mitarbeiter. Exchange sollte also mindestens 99,9 % erreichen.

PUE Power Usage Effectivness

Im Zusammenhang mit der Verfügbarkeit haben wir mal das Thema Effizienz des Rechenzentrums aufgenommen. Da die beiden Begriffe sich die Waage halten – oder eben nicht.

Der PUE-Wert sowie die DCiE (Data Centre Infrastructure Efficiency) sind vom Konsortium The Green Grid in 2007 definierte Messgrößen zur Ermittlung der Energieeffizienz im Rechenzentrum.

In der Gesamtenergie ist z.B. der Verbrauch für alle IT-Systeme, Storage, Netzwerk, Telekommunikation, Kühlungen, Klimaanlage, Schaltanlagen, unterbrechungsfreie Stromversorgung (USV) usw. enthalten.

Der PUE-Wert setzt die insgesamt verbrauchte Energie ins Verhältnis mit der Energieaufnahme der Systeme. Der DCiE-Wert zeigt dagegen den Wirkungsgrad der im Datenzentrum eingesetzten Energie. Der DCiE ist der Kehrwert der PUE, also 1/PUE.

Ein PUE-Wert von 3 würde z.B. bedeuten, dass zwei Drittel der eingesetzten Leistung für Wärme und Wärmeabführung verbraucht werden aber nur ein Drittel der eingesetzten Leistung dem Rechner „nutzt“. Es wäre also eine schlechte Effizienz.

Je mehr sich der PUE-Wert der 1 (das wäre eine 100%ige Effizienz) nähert, desto besser. Typische RZ PUEs liegen bei 1,3 – 1,7. Es finden sich jedoch aus Aussagen, dass real zwischen 1,8 und 2,5 anzunehmen ist, da die Berechnungen nicht immer korrekt sind bzw. beschönigt werden.

The Green Grid empfiehlt ein Messverfahren, das sich auf eine Erhebung der zwölfmonatigen Durchschnittswerte der Wirkleistung (kW) bezieht. Dieses Verfahren bezeichnet The Green Grid als „Level 3‐ Advanced‐Continuous Monitoring“. Etwas simpler ist hingegen, den tatsächlichen Energieverbrauch des Jahres, den „Jahres‐PUE‐Wert“ zu verwenden.

Microsoft erzielt in den eigenen Cloud Rechenzentren je nach Lokation einen PUE von 1,12 bis 1,2. (Quelle)