Bei der Resilienz von Rechenzentren geht es um die Bewertung von Risiken und die Anpassung von Praktiken
Die Aufgabe eines Rechenzentrums besteht darin, unternehmenskritische Daten zu speichern, zu verwalten und Zugriff darauf zu gewähren, die die Entscheidungsfindung ermöglichen, den Betrieb vorantreiben und strategische Initiativen unterstützen.’
Diese Daten müssen geschützt werden, unabhängig davon, ob dieser Schutz vorgeschrieben ist oder nicht. Andernfalls drohen Folgen wie Betriebsausfälle, erhebliche finanzielle Verluste oder Schlimmeres.
Wenn es um den Schutz von Daten geht, denkt man oft an Informationssicherheit: Verschlüsselung, Firewalls, Zugriffskontrollen. Aber Datenschutz hängt auch von der Verfügbarkeit ab. Ohne sie können Ausfallzeiten zu Datenverlust oder -beschädigung führen, was sich negativ auf den Betrieb und die Entscheidungsfindung auswirkt.
Um die Schwachstellen zu beheben, die zu Ausfallzeiten führen, müssen Sie zunächst die Risiken verstehen, die Ihrem Rechenzentrum innewohnen—und dann Schritte unternehmen, um diese zu mindern.
Bestimmung des Risikoprofils Ihres Rechenzentrums
Das Risikoprofil jedes Rechenzentrums ist anders und besteht aus einem komplexen Netz interner und externer Faktoren wie:’
- Wahrscheinlichkeit von Naturkatastrophen (Überschwemmungen, Hurrikane, Waldbrände, Erdbeben, Tornados, Eisstürme usw.)
- Möglichkeit von Geräteausfällen (Ausfälle von Kühlgeräten, Serverausfälle, versehentliche Unterbrechungen usw.)
- Möglichkeit von Stromunterbrechungen (Netzausfall, Spannungsschwankungen etc.)
- Standort und Zugang (Wahrscheinlichkeit eines unbefugten Betretens, Platzierung der Infrastruktur innerhalb einer Einrichtung usw.)
Sobald Sie die tatsächlichen Risiken kennen, können Sie die Eintrittswahrscheinlichkeit und die potenziellen Auswirkungen auf den Betrieb bewerten. Wie würden sich Ausfallzeiten für ein Krankenhaus im Notfall auf die Patientenversorgung und -sicherheit auswirken? Wie hoch sind für einen Hersteller die Kosten einer Verzögerung der Auftragsabwicklung oder der Kundentransaktionen?
Hier sind einige Beispiele, was Sie bei der Bewertung Ihres Risikoprofils berücksichtigen sollten, um die Widerstandsfähigkeit Ihres Rechenzentrums zu verbessern.
Um die Wahrscheinlichkeit eines Geräteausfalls zu bestimmen, können Sie Faktoren berücksichtigen wie:
- Schulung des Personals: Ergreifen die Mitarbeiter Maßnahmen, um menschliche Fehler proaktiv zu minimieren und Fehler bei Routineaufgaben zu vermeiden?
- Systemkonfigurationen: Unterstützt der Raum einen ausreichenden Luftstrom, um eine Überhitzung zu vermeiden?
- Alter der Ausrüstung: Erreichen die Geräte das Ende ihrer Lebensdauer?
- Instandhaltung: Werden regelmäßige Wartungsarbeiten durchgeführt, um Schwachstellen zu reduzieren?
Um die Wahrscheinlichkeit eines unbefugten Zugriffs zu bestimmen, können Sie Faktoren berücksichtigen wie:
- Drittanbieter: Wie viele Anbieter und Dienstleister haben Zugriff auf die Website? Sind sie vertrauenswürdig?
- Physischer Standort: Befindet sich das Rechenzentrum in einem gemeinsam genutzten Bereich? Ist es für die Leute leicht zu finden? (Könnten umherirrende Patienten es in einem Krankenhaus finden? Könnte ein Schüler es in einer Schule entdecken?)
- Zugriffskontrolle: Welche Arten von Sicherheitsvorkehrungen gibt es, um den Zugriff zu kontrollieren? Sind Besuchermanagementsysteme im Einsatz?
- Schulung des Personals: Achten die Mitarbeiter auf verdächtiges Verhalten und sind sie in der Lage, es zu erkennen? Befolgen sie Zugriffsprotokolle?
Anhand der Antworten, die Sie finden, können Sie Verbesserungen nach Dringlichkeit und potenziellen Auswirkungen priorisieren, um die Ausfallsicherheit Ihres Rechenzentrums zu verbessern.
Grundlegendes zu den Anforderungen für den Betrieb bei Katastrophen und anderen Ereignissen
Da sie für die öffentliche Sicherheit von entscheidender Bedeutung sind, schreibt der International Building Code (IBC) vor, dass bestimmte Arten von Einrichtungen, darunter viele Rechenzentren, während Naturkatastrophen und anderen Ereignissen ihren Betrieb aufrechterhalten müssen.’ Dies sollten Sie bei der Bewertung der Resilienz von Rechenzentren berücksichtigen.
Um die Risikostufen zu erkennen, kategorisiert IBC die Einrichtungen in vier Gruppen:
- Kategorie I umfasst Gebäude, bei denen ein Ausfall ein minimales Sicherheitsrisiko darstellt: landwirtschaftliche Anlagen und Lagergebäude
- Kategorie II umfasst Gebäude, die nicht in andere Kategorien fallen: die meisten Gewerbe- und Wohngebäude
- Zur Kategorie III gehören Gebäude, bei denen ein Ausfall ein erhebliches Sicherheitsrisiko darstellt: Hörsäle, Theater, Kraftwerke, Gefängnisse, Wasseraufbereitungsanlagen usw.
- Kategorie IV umfasst wesentliche Einrichtungen, die im Katastrophenfall betriebsbereit bleiben müssen: Flugkontrolltürme, Chemieanlagen, Rechenzentren, Feuer-/Polizeistationen, Krankenhäuser usw.
Um die Anforderungen zu erfüllen, müssen Einrichtungen der Kategorie IV strenge Planungs- und Baustandards erfüllen, die die Widerstandsfähigkeit gewährleisten. Und das gilt auch für die Infrastruktur des Rechenzentrums: Racks, Schränke usw.
Die Erdbebensicherheitsklasse eines Schranks oder Racks’ gibt an, wie gut es aktive Geräte schützen und Schäden (und damit Datenverluste) bei starken Vibrationen reduzieren kann. Je höher die Erdbebensicherheitsklasse, desto besser ist die Widerstandsfähigkeit des Racks oder Schranks gegenüber einem Ereignis.’ Beispielsweise können Schaltschränke mit einer seismischen Bewertung der Zone 4 aktive Geräte vor Schäden bei schweren Erdbeben oder anderen seismischen Aktivitäten schützen.
Um sicherzustellen, dass der Betrieb nicht gestört wird, ist es entscheidend, sich seiner Umgebung bewusst zu sein—und zu wissen, was zum Schutz kritischer Infrastrukturen erforderlich ist—.’ In einigen Gerichtsbarkeiten bedeutet dies auch, dass lokale Vorschriften und Anforderungen eingehalten werden müssen.
Da sie beispielsweise gemäß IBC als Einrichtungen der Kategorie 4 eingestuft werden, benötigen möglicherweise auch Krankenhäuser, die sich nicht in Erdbebengebieten befinden, Erdbebenschutzkabinette.’’ Einige Bundesstaaten haben möglicherweise auch zusätzliche Mandate für Gesundheitseinrichtungen, die Anforderungen an erdbebensichere Schränke enthalten können, unabhängig davon, wo sich die Einrichtung befindet.
Es ist auch wichtig zu beachten, dass sich die Anforderungen ständig weiterentwickeln. Sie können sich im Laufe der Zeit ändern und tun dies auch. Betrachten Sie als Beispiel die Veränderung der bewährten Verfahren für die Installation von Leitertrassen.
In der Vergangenheit wurden Leiterwannen in Krankenhäusern mit L-Winkeln an der Wand montiert. Bei seismischen Aktivitäten üben Leiterwannen jedoch manchmal extreme Kräfte auf die Wände aus, die Schäden verursachen. Als dies entdeckt wurde, wurden Leiterwannen einige Zentimeter von den Wänden entfernt installiert, um Flexibilität zu ermöglichen.
Heutzutage verlangen die Installationsnormen jedoch wieder, dass Leiterwannen direkt an der Wand montiert, aber nicht an Trockenbauwänden, sondern an strukturellen Stützen wie Ständern verankert werden. Diese Änderung sorgt für eine sicherere, stabilere Installation und verhindert gleichzeitig Wand- und Kabelschäden.
Es ist nicht nur wichtig, sich über diese Best Practices auf dem Laufenden zu halten, weil es’erforderlich ist, sondern auch, weil es für den Schutz Ihrer Daten unerlässlich ist.’
Was für ein Rechenzentrum gut funktioniert, funktioniert’nicht für alle
Vom physischen Layout Aufgrund des Klimas unterliegt jedes Rechenzentrum seinem eigenen Variablenrahmen. Was in einer Einrichtung gut funktioniert, ist aufgrund dieser Unterschiede möglicherweise in einer anderen Einrichtung nicht wirksam oder wird nicht empfohlen.
In Los Angeles und Teilen von San Francisco beispielsweise gelten besondere Anforderungen für Kabelwege Installation in Krankenhäusern, um Schwankungen und Schäden zu vermeiden, die zu Ausfallzeiten führen. Hier müssen Deckenhänger anstelle von herkömmlichem Draht Gewindestangen für mehr Stabilität verwenden. L-Halterungen müssen sicher verankert sein, mit einer Verankerungstiefe von mindestens einem Zoll.
Aber diese Praxis in einen Bundesstaat zu bringen, in dem Tornados wahrscheinlich sind, ist möglicherweise nicht sehr passend. Die Gefahr von umherfliegenden Trümmern ist ein kritischer Faktor: Wenn sich Gewindestangen lösen, könnten sie bei starkem Wind zu Geschossen werden.
Entscheidungen auf der Grundlage Ihrer Umgebung, möglicher Risiken und der Wahrscheinlichkeit des Eintretens dieser Risiken zu treffen, ist eine gute Möglichkeit, die Ausfallsicherheit Ihres Rechenzentrums sicherzustellen und Ihre Daten zu schützen.
Entdecken Sie, wie wir Sie bei der Unterstützung unternehmenskritischer Rechenzentrumsvorgänge unterstützen können.