Bei der Resilienz von Rechenzentren geht es um die Bewertung von Risiken und die Anpassung von Praktiken
Die Aufgabe eines Rechenzentrums besteht darin, unternehmenskritische Daten zu speichern, zu verwalten und zugänglich zu machen, die die Entscheidungsfindung ermöglichen, den Betrieb vorantreiben und strategische Initiativen unterstützen.
Diese Daten müssen geschützt werden, unabhängig davon, ob dieser Schutz vorgeschrieben ist oder nicht. Andernfalls drohen Folgen wie Betriebsausfälle, erhebliche finanzielle Verluste oder Schlimmeres.
Wenn es um den Schutz von Daten geht, denkt man oft an Informationssicherheit: Verschlüsselung, Firewalls, Zugriffskontrollen. Aber Datenschutz hängt auch von der Verfügbarkeit ab. Ohne sie können Ausfallzeiten zu Datenverlust oder -beschädigung führen, was sich negativ auf den Betrieb und die Entscheidungsfindung auswirkt.
Um die Schwachstellen zu beheben, die zu Ausfallzeiten führen, müssen Sie zunächst die mit Ihrem Rechenzentrum verbundenen Risiken verstehen und dann Maßnahmen ergreifen, um diese zu mindern.
Bestimmung des Risikoprofils Ihres Rechenzentrums
Das Risikoprofil jedes Rechenzentrums ist unterschiedlich und setzt sich aus einem komplexen Geflecht interner und externer Faktoren zusammen, wie z. B.:
- Wahrscheinlichkeit von Naturkatastrophen (Überschwemmungen, Hurrikane, Waldbrände, Erdbeben, Tornados, Eisstürme usw.)
- Möglichkeit von Geräteausfällen (Ausfälle von Kühlgeräten, Serverausfälle, versehentliche Unterbrechungen usw.)
- Möglichkeit von Stromunterbrechungen (Netzausfall, Spannungsschwankungen etc.)
- Standort und Zugang (Wahrscheinlichkeit eines unbefugten Betretens, Platzierung der Infrastruktur innerhalb einer Einrichtung usw.)
Sobald Sie die tatsächlichen Risiken kennen, können Sie die Eintrittswahrscheinlichkeit und die potenziellen Auswirkungen auf den Betrieb bewerten. Wie würden sich Ausfallzeiten für ein Krankenhaus im Notfall auf die Patientenversorgung und -sicherheit auswirken? Wie hoch sind für einen Hersteller die Kosten einer Verzögerung der Auftragsabwicklung oder der Kundentransaktionen?
Hier sind einige Beispiele, was Sie bei der Bewertung Ihres Risikoprofils berücksichtigen sollten, um die Widerstandsfähigkeit Ihres Rechenzentrums zu verbessern.
Um die Wahrscheinlichkeit eines Geräteausfalls zu bestimmen, können Sie Faktoren berücksichtigen wie:
- Schulung des Personals: Ergreifen die Mitarbeiter Maßnahmen, um menschliche Fehler proaktiv zu minimieren und Fehler bei Routineaufgaben zu vermeiden?
- Systemkonfigurationen: Unterstützt der Raum einen ausreichenden Luftstrom, um eine Überhitzung zu vermeiden?
- Alter der Ausrüstung: Erreichen die Geräte das Ende ihrer Lebensdauer?
- Instandhaltung: Werden regelmäßige Wartungsarbeiten durchgeführt, um Schwachstellen zu reduzieren?
Um die Wahrscheinlichkeit eines unbefugten Zugriffs zu bestimmen, können Sie Faktoren berücksichtigen wie:
- Drittanbieter: Wie viele Anbieter und Dienstleister haben Zugriff auf die Website? Sind sie vertrauenswürdig?
- Physischer Standort: Befindet sich das Rechenzentrum in einem gemeinsam genutzten Bereich? Ist es für die Leute leicht zu finden? (Könnten wandernde Patienten es in einem Krankenhaus finden? Könnte ein Schüler es in einer Schule entdecken?)
- Zugriffskontrolle: Welche Arten von Sicherheitsvorkehrungen gibt es, um den Zugriff zu kontrollieren? Sind Besuchermanagementsysteme im Einsatz?
- Schulung des Personals: Achten die Mitarbeiter auf verdächtiges Verhalten und sind sie in der Lage, es zu erkennen? Befolgen sie Zugriffsprotokolle?
Anhand der Antworten, die Sie finden, können Sie Verbesserungen nach Dringlichkeit und potenziellen Auswirkungen priorisieren, um die Ausfallsicherheit Ihres Rechenzentrums zu verbessern.
Grundlegendes zu den Anforderungen für den Betrieb bei Katastrophen und anderen Ereignissen
Da sie für die öffentliche Sicherheit unerlässlich sind, verlangt der Internationale Baukodex (IBC ), dass bestimmte Arten von Einrichtungen, darunter viele Rechenzentren, auch bei Naturkatastrophen und anderen Ereignissen weiter betrieben werden müssen. Dies sollten Sie bei der Bewertung der Resilienz von Rechenzentren berücksichtigen.
Um die Risikostufen zu erkennen, kategorisiert IBC die Einrichtungen in vier Gruppen:
- Kategorie I umfasst Gebäude, bei denen ein Ausfall ein minimales Sicherheitsrisiko darstellt: landwirtschaftliche Anlagen und Lagergebäude
- Kategorie II umfasst Gebäude, die nicht in andere Kategorien fallen: die meisten Gewerbe- und Wohngebäude
- Zur Kategorie III gehören Gebäude, bei denen ein Ausfall ein erhebliches Sicherheitsrisiko darstellt: Hörsäle, Theater, Kraftwerke, Gefängnisse, Wasseraufbereitungsanlagen usw.
- Kategorie IV umfasst wesentliche Einrichtungen, die im Katastrophenfall betriebsbereit bleiben müssen: Flugkontrolltürme, Chemieanlagen, Rechenzentren, Feuer-/Polizeistationen, Krankenhäuser usw.
Um die Anforderungen zu erfüllen, müssen Einrichtungen der Kategorie IV strenge Planungs- und Baustandards erfüllen, die die Widerstandsfähigkeit gewährleisten. Und das gilt auch für die Infrastruktur des Rechenzentrums: Racks, Schränke usw.
Die seismische Bewertung eines Schaltschranks oder Schaltschranks gibt an, wie gut er aktive Geräte schützen und Schäden (und damit Datenverluste) bei starken Vibrationen reduzieren kann. Je höher die seismische Bewertung, desto besser ist die Fähigkeit des Schaltschranks, ein Ereignis zu tolerieren. Beispielsweise können Schaltschränke mit einer seismischen Bewertung der Zone 4 aktive Geräte vor Schäden bei schweren Erdbeben oder anderen seismischen Aktivitäten schützen.
Um sicherzustellen, dass der Betrieb nicht gestört wird, müssen Sie sich Ihrer Umgebung bewusst sein und wissen, was zum Schutz kritischer Infrastrukturen erforderlich ist. In einigen Gerichtsbarkeiten bedeutet dies auch, dass lokale Vorschriften und Anforderungen eingehalten werden müssen.
Da sie beispielsweise als Einrichtung der Kategorie 4 im Rahmen der IBC gelten, können auch Krankenhäuser, die sich nicht in Erdbebenzonen befinden,Erdbebenschränke benötigen. Einige Bundesstaaten haben möglicherweise auch zusätzliche Mandate für Gesundheitseinrichtungen, die Anforderungen an erdbebensichere Schränke enthalten können, unabhängig davon, wo sich die Einrichtung befindet.
Es ist auch wichtig zu beachten, dass sich die Anforderungen ständig weiterentwickeln. Sie können sich im Laufe der Zeit ändern und tun dies auch. Betrachten Sie als Beispiel die Veränderung der bewährten Verfahren für die Installation von Leitertrassen.
In der Vergangenheit wurden Leiterwannen in Krankenhäusern mit L-Winkeln an der Wand montiert. Bei seismischen Aktivitäten üben Leiterwannen jedoch manchmal extreme Kräfte auf die Wände aus, die Schäden verursachen. Als dies entdeckt wurde, wurden Leiterwannen einige Zentimeter von den Wänden entfernt installiert, um Flexibilität zu ermöglichen.
Heutzutage verlangen die Installationsnormen jedoch wieder, dass Leiterwannen direkt an der Wand montiert, aber nicht an Trockenbauwänden, sondern an strukturellen Stützen wie Ständern verankert werden. Diese Änderung sorgt für eine sicherere, stabilere Installation und verhindert gleichzeitig Wand- und Kabelschäden.
Es ist wichtig, über diese Best Practices auf dem Laufenden zu bleiben, nicht nur, weil es eine Voraussetzung ist, sondern auch, weil es für den Schutz Ihrer Daten unerlässlich ist.
Was für ein Rechenzentrum gut funktioniert, funktioniert nicht für alle
Vom physischen Layout bis zum Klima arbeitet jedes Rechenzentrum in seinem eigenen Rahmen von Variablen. Was in einer Einrichtung gut funktioniert, ist aufgrund dieser Unterschiede möglicherweise in einer anderen Einrichtung nicht wirksam oder wird nicht empfohlen.
Beispielsweise gelten in Los Angeles und Teilen von San Francisco besondere Anforderungen an die Installation von Kabeltrassen in Krankenhäusern, um Schwankungen und Schäden zu vermeiden, die zu Ausfallzeiten führen. Hier müssen Deckenhänger anstelle von herkömmlichem Draht Gewindestangen für mehr Stabilität verwenden. L-Halterungen müssen sicher verankert sein, mit einer Verankerungstiefe von mindestens einem Zoll.
Aber diese Praxis in einen Bundesstaat zu bringen, in dem Tornados wahrscheinlich sind, ist möglicherweise nicht sehr passend. Die Gefahr von umherfliegenden Trümmern ist ein kritischer Faktor: Wenn sich Gewindestangen lösen, könnten sie bei starkem Wind zu Geschossen werden.
Entscheidungen auf der Grundlage Ihrer Umgebung, möglicher Risiken und der Wahrscheinlichkeit des Eintretens dieser Risiken zu treffen, ist eine gute Möglichkeit, die Ausfallsicherheit Ihres Rechenzentrums sicherzustellen und Ihre Daten zu schützen.
Entdecken Sie, wie wir Sie bei der Unterstützung unternehmenskritischer Rechenzentrumsvorgänge unterstützen können.