Intelligente Gebäude

Der Wert einer Risikobewertung des Rechenzentrums für Ihr nächstes Projekt

Shad Sechrist

Für Rechenzentren bedeutet Risiko nicht nur ungeplante Ausfallzeiten – Risiko kann gleichbedeutend sein mit verlorenen Einnahmen, beschädigten Geräten, verärgerten Kunden und sogar Gefährdung von Menschenleben.

 

Die Verringerung des Risikos von Rechenzentren beginnt mit der Beantwortung einer einfachen Frage: Was könnte kritische Systeme und Daten beeinträchtigen?

 

Vor Beginn eines Projekts kann eine Risikobewertung und -analyse für das Rechenzentrum diese Frage beantworten. Diese beinhaltet die Identifizierung der potenziellen Risiken, die Beurteilung, wie „riskant“ diese wirklich sind (wie stark sich die Risiken auf die Leistung des Unternehmens auswirken werden, wenn sie eintreten) und wie die Möglichkeit für das Eintreten dieser Risiken gemindert werden kann.

 

Obwohl es unmöglich ist, alle potenziellen Ursachen für Ausfallzeiten zu eliminieren – menschliches Versagen, Bedrohungen der Cybersicherheit, Naturkatastrophen, Serverausfälle und so weiter – ist es viel praktischer, eine Risikobewertung für das Rechenzentrum durchzuführen, um die vorherrschenden Risiken, die zu Ausfallzeiten führen könnten, zu verringern.

 

Bei neuen Rechenzentrumsprojekten können diese Gefährdungen der Verfügbarkeit durch Entscheidungen reduziert werden, die während des Entwurfs- und Planungsprozesses des Rechenzentrums getroffen wurden. Es beginnt mit der Bestimmung der richtigen Verfügbarkeitsklasse des Rechenzentrums. Sobald Sie diese kennen, können Sie die Mindestanforderungen an Leistung und Verfügbarkeit für Ihr Projekt festlegen.

 

Die „Verfügbarkeit“ eines Rechenzentrums bezieht sich auf seine Fähigkeit, die ihm zugedachte Funktion zu erfüllen. Dieser mathematische Ausdruck stellt die Systemverfügbarkeit dar.

 

Betriebszeit / (Betriebszeit + geplante Ausfallzeit + ungeplante Ausfallzeit) = Verfügbarkeit

 

In dieser Gleichung:

 

  • Verfügbarkeit und Ausfallzeit werden in Zeiteinheiten innerhalb eines bestimmten Zeitraums gemessen
  • Geplante Ausfallzeiten umfassen Dinge wie vorbeugende Wartung, Einrichtung von Geräten, Upgrades, Tests und Optimierung
  • Ungeplante Ausfallzeiten umfassen u. a. Reparaturen aufgrund von Ausfällen, Wartungsverzögerungen und anlagenbedingte Ausfälle oder Unterbrechungen.

 

ANSI/TIA-942 klassifiziert Rechenzentren in vier Stufen und verwendet dabei Bewertungen in den Bereichen Telekommunikation, Elektrik, Architektur und Mechanik, je nachdem, wie das Rechenzentrum entworfen und konstruiert werden sollte:

 

  • Bewertung 1: Komponenten mit einfacher Kapazität und einem einzigen, nicht redundanten Verteilungspfad
  • Bewertung 2: Redundante Kapazitätskomponenten und ein einziger, nicht-redundanter Verteilungspfad
  • Bewertung 3: Redundante Kapazitätskomponenten und unabhängige Verteilungswege
  • Bewertung 4: Redundante Kapazitätskomponenten und unabhängiger Verteilungsweg

 

Das Uptime Institute klassifiziert Rechenzentren nach einem vierstufigen Ansatz, der den Grad der erforderlichen Resilienz angibt:

 

  • Stufe 1: Grundlegende Kapazitätsstufe, die nur eine unterbrechungsfreie Stromversorgung (USV) für Ausfälle, einen Bereich für IT-Systeme, eine spezielle Kühlung und einen Motorgenerator erfordert
  • Stufe 2: Redundante Kapazitätskomponenten für Leistung und Kühlung
  • Stufe 3: Gleichzeitige Wartbarkeit mit redundanten Komponenten
  • Stufe 4: Unabhängige und physisch isolierte Systeme, die als redundante Kapazitätskomponenten und Verteilungswege fungieren

 

Um die richtige Verfügbarkeitsklasse für Ihr Rechenzentrumsprojekt zu bestimmen, sind drei Fragen zu beantworten.

 

1. Was sind die betrieblichen Anforderungen an das Rechenzentrum?

 

Berücksichtigen Sie die Zeit, die für die Durchführung geplanter Wartungsabschaltungen zur Verfügung steht. Dies umfasst auch die Zeit, die für das Herunterfahren von Systemen, das Ausschalten von Systemen und die Arbeit über Probleme und Sorgen bei der Wartung zur Verfügung steht. Wenn das Rechenzentrum rund um die Uhr in Betrieb sein muss und keinen stundenlangen geplanten Wartungsstillstand überstehen kann, dann handelt es sich wahrscheinlich um ein Stufe-4-Rechenzentrum, das für jede Komponente eine eingebaute Redundanz benötigt.

 

2. Wie hoch ist die operative Verfügbarkeit des Rechenzentrums?

 

Bestimmen Sie die Anforderungen an die betriebliche Verfügbarkeit des Rechenzentrums (die Gesamtzeit, die das Rechenzentrum ohne Unterbrechung Support bieten muss).

 

Hier kommt der Ausdruck „Fünf-Neunen-Verfügbarkeit“ (Hochverfügbarkeit) ins Spiel. Die Verfügbarkeit wird normalerweise in Neunen ausgedrückt. Eine „Fünf-Neunen-Verfügbarkeit“ bedeutet zum Beispiel 99,999 % Verfügbarkeit oder eine durchschnittliche Ausfallzeit von weniger als sechs Minuten pro Jahr.

 

3. Wie wirkt sich die Ausfallzeit auf das Rechenzentrum aus?

 

Der dritte und letzte Schritt besteht darin, die Auswirkungen von Ausfallzeiten des Rechenzentrums auf das Unternehmen zu identifizieren. Wie stark wird sich dies auf das Geschäft auswirken? Was sind die Folgen?

 

Nicht alle Ausfallzeiten sind gleich. So können beispielsweise 15 Minuten Ausfallzeit für ein Versicherungs- oder Medienunternehmen möglicherweise nicht annähernd so gravierend sein wie 15 Minuten Ausfallzeit für ein Krankenhaus oder eine Fertigungsanlage.

 

Vergessen Sie nicht: Rechenzentrumstypen und die Cloud

 

Sobald diese Fragen beantwortet sind, ist es an der Zeit, zwei weitere Faktoren für Ihre Risikobewertung des Rechenzentrums zu berücksichtigen: den Typ des Rechenzentrums und das Vorhandensein einer Cloud-Umgebung. Beide Überlegungen spielen bei der Bestimmung des Risikoniveaus oder der Risikotoleranz eine Rolle.

 

So ist zum Beispiel die Verfügbarkeit in einem Multi-Tenant- oder einem Colocation-Rechenzentrum, das Dienste für Finanzeinrichtungen, Gesundheitseinrichtungen, IT, Fertigungsbetriebe, Regierungsbehörden und den Einzelhandel bereitstellt, von entscheidender Bedeutung. Kunden zahlen für ein gewisses Maß an Redundanz und die Gewissheit, dass die Systeme immer verfügbar sind. Ungeplante Ausfallzeiten könnten die Geschäfte aller Kunden zum Erliegen bringen.

 

Neben dem Rechenzentrumtyp, mit dem Sie arbeiten, müssen Sie auch die Cloud berücksichtigen, wenn Sie eine Risikobewertung des Rechenzentrums durchführen.

 

Die Public Cloud bietet Computing-Dienste über einen Drittanbieter über das Internet an, und ein Drittanbieter ist für die Verwaltung und Wartung verantwortlich. Eine Private Cloud ist eine Rechenzentrumsinfrastruktur vor Ort, die Server-, Speicher-, Arbeitsspeicher- und Netzwerkkapazitäten enthält. Die Hybrid-Cloud kombiniert die Private und Public Cloud. Jede hat seine eigenen Anforderungen und Toleranzen für Ausfallzeiten.

 

Planung für mögliche Zwischenfälle

 

Der letzte Schritt bei der Risikobewertung eines neuen Rechenzentrums ist die Etablierung eines Business-Continuity- oder Disaster-Recovery-Plans, um sicherzustellen, dass die Informationen im Katastrophenfall schnell wiederhergestellt werden können.

 

Da jede IT-Umgebung einzigartig ist, gibt es kein Patentrezept, das für alle Rechenzentren gilt, aber es gibt drei Dinge, die jeder Plan umfassen sollte:

 

  1. Vorbeugende Maßnahmen, die versuchen, eine Katastrophe zu vermeiden, indem sie das Risiko erkennen und reduzieren. Diese Maßnahmen können Software-Sicherungspläne, unterbrechungsfreie Stromversorgungen, Generatoren sowie routinemäßige Wartung und Inspektion umfassen.
  2. Ermittlungsmaßnahmen, welche Aktionen zur Vermeidung ungewünschter Ereignisse erfordern. Diese können Brand- und Sicherheitssysteme, Antivirensoftware, Sicherungssoftware und das Training von Mitarbeiterinnen und Mitarbeitern umfassen.
  3. Korrigierende oder reaktive Maßnahmen, die den Umfang der Ausfallzeiten oder Verluste minimieren.
    1. Disaster Recovery as a Service (DRaaS) ist eine geografisch verteilte Spiegelungslösung, die die Wiederherstellung von Daten und die Fähigkeit zur Wiederherstellung ermöglicht, wenn das Hauptrechenzentrum fehlerhaft ist oder komplett ausfällt. Außerdem können Sie damit Daten bis zu einem bestimmten Zeitpunkt wiederherstellen.
    2. Errichten Sie ein zweites Rechenzentrum und betreiben Sie es passiv, bis es gebraucht wird – oder betreiben Sie es aktiv zusammen mit dem primären Rechenzentrum, um die Verarbeitung und den Speicher im Katastrophen- oder Unglücksfall zu übernehmen.

 

Wenn Sie Hilfe bei der Erstellung einer Risikobewertung für Ihr nächstes Projekt benötigen, sind unsere internen Experten für Sie da.

 

Wenn Sie mehr über die Risikobewertung von Rechenzentren und viele andere Themen rund um Rechenzentren erfahren möchten, besuchen Sie unseren neuen Trainingskurs „Introducing Data Center Essentials Level 1“ (Einführung in die Grundlagen für Rechenzentren), der als Teil der Belden Academy auf Abruf verfügbar ist. Verdienen Sie sich drei CEC-Punkte, erforschen Sie die Merkmale, die Rechenzentrumsprojekte einzigartig machen, und entdecken Sie Tipps für die richtige Abwicklung von Rechenzentrumsprojekten von Anfang bis Ende.

 

Beginnen Sie hier, um von unseren Rechenzentrumsexperten zu lernen und Ihre Zertifizierung zu erhalten.