Dell EMC OpenManage Server Administrator

Ereignistypdefinitionen und Funktionszustand von Komponenten

Server Administrator klassifiziert Ereignisse, die sich auf bestimmte wichtige Komponenten des Systems auswirken, mit Hilfe eines Ereignistyps. Normal, Warnung und Kritisch sind die drei am häufigsten als Komponentenstatus angezeigten Ereignistypen.

In diesem Hilfemodul werden Begriffe im Zusammenhang mit Ereignistypen, Zuständen und Schweregraden definiert. Lesen Sie dieses Hilfemodul, wenn Sie weitere Details zu den einzelnen Begriffen wünschen, die Server Administrator zur Klassifizierung von Ereignissen und zur Identifikation von Funktionszuständen verwendet.

Ereignistypen und zugehörige Schweregrade

Im Folgenden werden die unterscheidbaren Attribute des Ereignisses aufgeführt, unabhängig davon, ob Server Administrator den Funktionszustand einer Komponente ausgibt oder ein Ereignis klassifiziert: die überwachte Komponente bzw. Redundanz sowie Typ, Status und Schweregrad des Ereignisses, dem die Komponente unterliegt.

Komponente oder Redundanz

Server Administrator klassifiziert sowohl Komponenten als auch die Redundanz bei bestimmten Komponenten nach Typ, Schweregrad und Status.

Komponenten

Alle Komponenten in einem System sind wichtig. Systemverwaltungsanwendungen wie z. B. Server Administrator sondern einige Komponenten aus, wenn diese besondere Aufmerksamkeit erfordern. Funktionsfähige Systeme stützen sich insbesondere auf eine stetige Stromversorgung mit entsprechender Spannung für den ordnungsgemäßen Betrieb der Systemkomponenten. Die Stromversorgung erfolgt über den systemweiten Wechselstromschalter und in die Netzteile des Systems. Die Systemkomponenten benötigen außerdem einen geeigneten Temperaturbereich im Gehäuse. Programme ausführen und Berechnungen ausgehend von Daten auszuführen, erfordert gut funktionierenden RAM (Random Access Memory, dynamischer Speicher mit wahlfreiem Zugriff). Als Ergebnis dieser Anforderungen sind der Netzschalter, die Netzteile, Lüfter und der Systemspeicher einige der wichtigsten Komponenten, die der Server Administrator überwacht.

Redundanz

Server Administrator überwacht den Funktionszustand redundanter Komponenten und meldet den Redundanzstatus für das System.

Abhängig davon, wie wichtig ein System für die Erreichung entscheidender Ziele in einem Unternehmen oder einer Organisation ist, werden einige der in das System eingebauten Komponenten redundant ausgelegt. Ein System, das wichtig für die Erreichung entscheidender Ziele in einer Organisation ist, hat sehr wahrscheinlich redundante Komponenten. Eine redundante Komponente ist so konzipiert, dass sie in Betrieb geht, wenn die Begleitkomponente ausfällt. Redundanz hilft, ein System vor Ausfallzeit durch Herunterfahren oder Komponentenschaden zu schützen.

Volle Redundanz Volle Redundanz für das gesamte System ist hergestellt, wenn alle Geräte innerhalb ihrer normalen Grenzwerte arbeiten. Wenn bei einem System für volle Redundanz vier Lüfter erforderlich sind und alle vier Lüfter funktionieren, besteht für das System vollständige Redundanz für die Lüfterkomponente. Wenn einer der beiden primären Lüfter ausfällt, ist für jeden Lüfter ein Reservelüfter verfügbar. Bei voller Redundanz sind neben der normalen vorbeugenden Wartung keine Maßnahmen erforderlich.
Herabgesetzte Redundanz Bei herabgesetzter Redundanz funktionieren einige der Komponenten nicht, die für volle Redundanz erforderlich sind. Das System ist betriebsbereit, es funktionieren jedoch nicht genügend Komponenten, sodass im Falle eines Komponentenausfalls keine betriebsbereite Komponente in Reserve ist, die den Betrieb übernehmen könnte. Wenn beispielsweise vier Lüfter für die volle Redundanz erforderlich sind, liegt bei drei betriebsbereiten Lüftern herabgesetzte Redundanz vor. Nur einer der beiden primären Lüfter hat einen in Reserve, wenn er ausfällt.
Verlorene Redundanz Verlorene Redundanz bedeutet, dass im System nur die Mindestanzahl an Komponenten funktioniert, um einen Systemfehler zu verhindern. Keine redundanten Komponenten funktionieren. Wenn zum Erreichen voller Redundanz vier Lüfter erforderlich sind, aber nur zwei Lüfter funktionieren, steht bei einem Lüfterausfall für keinen der primären Lüfter ein Reservelüfter zur Verfügung.

Typ

Ein Ereignis wird nach Typ klassifiziert. Beispielereignistypen sind: Normal, Warnung und Kritisch.

Normal Ereignisse vom Typ Normal geben an, dass eine Komponente innerhalb eines Wertebereichs funktioniert, in dem die Komponente ihre Funktion im System fehlerfrei ausüben kann. Ein anderer Begriff, der Komponenten mit dem Status Normal häufig zugewiesen wird, ist OK. Wenn eine Komponente OK oder ein Ereignis Normal ist, ist es für den System-Operator nicht notwendig, Korrekturmaßnahmen einzuleiten.
Warnung Warnungsereignisse treten auf, wenn eine verwaltete Komponente nicht optimal funktioniert, jedoch weiterhin betriebsfähig ist. Warnungsereignisse gewähren System-Operatoren Vorlaufzeit. Die geeignete Maßnahme bei Warnungsereignissen ist häufig eine genauere Untersuchung und die Terminfestlegung für die Wartung der Komponente. Warnungen machen den Systembediener auch darauf aufmerksam, auf eine Komponente größere Aufmerksamkeit zu richten, bis die Komponente wieder zum normalen Betrieb zurückkehrt. Hauptbenutzer und Administratoren können die Minimal- und Maximalwerte für ein Warnungsereignis definieren. Die Berechtigung zur Festlegung des Warnungsbereichs ermöglicht Hauptbenutzern und Administratoren, eine Reaktionszeit einzubauen, die Ihnen bleibt, um auf eine betriebsbereite Komponente mit Anzeichen herabgesetzter Leistung zu reagieren.
Kritisch Ein kritisches Ereignis zeigt an, dass eine Komponente entweder außerhalb der Grenzen funktioniert, die einen ordnungsgemäßen Betrieb gewährleisten, oder ganz ausgefallen ist. Eine Komponente, die überhaupt nicht mehr funktioniert, wird häufig als nicht wiederherstellbar bezeichnet. Der kritische Bereich für eine Komponente wird von deren Systemhersteller definiert, da dieser die Komponente entwickelt hat und am besten weiß, bei welchen Parametern die Komponente ordnungsgemäß funktioniert. Kritische Fehlerereignisse sind dringlicher als Warnereignisse und System-Operatoren betrachten diesen Typ der Beeinträchtigung bei der Komponentenleistung als schwerwiegender. Geeignete Maßnahmen bei einer kritischen oder fehlerhaften Komponente können das sofortige Herunterfahren des Systems oder das Veranlassen des baldigen Austauschs der Komponente sein.

Zustand

Der Status einer Komponente oder eines Systemattributs ist entweder betriebsbereit, herabgesetzt oder nicht betriebsbereit.

Im Betrieb Eine betriebsgerechte Temperatur bedeutet, dass Temperatursonden in einem Gehäuse Temperaturen messen, die im normalen Betriebsbereich liegen.
Herabgesetzt Eine herabgesetzte Temperatur bedeutet, dass Temperatursonden in einem Gehäuse Temperaturen messen, die im Warnungsbereich liegen. Der Warnungsbereich wird durch die minimalen und maximalen Betriebstemperaturen definiert, die erreicht werden müssen, bevor eine Warnung ausgegeben wird. Die Temperatur im Gehäuse liegt entweder unter der minimalen oder über der maximalen Normaltemperatur.
Nicht betriebsbereit Ein(e) nicht betriebsbereite(s) Komponente oder Komponentenattribut bedeutet, dass die Komponente entweder im Fehler- oder nicht wiederherstellbaren Bereich arbeitet. Beispiel anhand des Temperaturwerts: Wenn das System überhaupt noch funktioniert, liegt der Temperaturwert so weit über oder unter dem normalen Wert, dass ein temperaturbedingtes Herunterfahren des Systems ausgelöst werden könnte, oder dass Systemkomponenten beschädigt oder zerstört werden könnten.

Schweregrad

Jeder Ereignistyp und -zustand für eine Komponente wird entsprechend seines Schweregrads eingestuft. Zu den Schweregraden für Ereignisse gehören "Zur Information", "Minder schwer", "Schwerwiegend" und "Kritisch".

Informativ Bei einer Komponente mit Status "Normal" oder beim Ereignistyp "Normal" ist die Komponente betriebsbereit und der dem normalen Ereignis zugeordnete Schweregrad ist "Zur Information". Server Administrator führt für normale Ereignisse nur Maßnahmen zu Informationszwecken aus. Server Administrator informiert den System-Operator, dass eine Komponente normal funktioniert.
Minder schwer Ein Warnungsereignis kann, abhängig von der Komponente, minder schwer oder kritisch sein. Wenn Sie beispielsweise einen Lüfter in einem System mit Lüfterredundanz ausbauen, ist der Schweregrad dieses Ereignisses minder schwer.
Schwerwiegend Bestimmte Warnungsereignisse können auf schwerwiegende Probleme im System hinweisen. Wenn ein Lüfter über einen längeren Zeitraum außerhalb des Systems bleibt, könnte das Ereignis schwerwiegend werden, da die Redundanz gefährdet ist. Längere Abwesenheit einer Systemkomponente, deren Funktion in einer Organisation Redundanz erfordert, könnte zu Komponentenausfällen führen, ohne dass Reservekomponenten verfügbar wären. Dies wiederum könnte zu einem Systemausfall führen.
Kritisch Werden Komponenten festgestellt, die innerhalb des Fehlerbereichs arbeiten, liegt ein kritisches Ereignis vor. Das Versagen von Komponenten wie Lüfter, Netzstromkabel oder Speichermodulen gefährdet den unterbrechungsfreien Betrieb des Systems und die Erhaltung von Daten.

Wie Ereignistyp, Schweregrad und Status miteinander in Beziehung stehen

Die folgende Tabelle bietet Beispielereignisse für wichtige Komponenten und stellt den Zusammenhang zwischen Ereignistyp, Schweregrad und Zustand dar.

ANMERKUNG: Aufgrund der Einschränkungen des VMware ESXi-Betriebssystems steht die Funktion "Warnungsmaßnahmen einstellen" in dieser Version von Server Administrator nicht zur Verfügung.
Tabelle 1. Wie Ereignistyp, Schweregrad und Status miteinander in Beziehung stehen
Komponente Ereignis- oder Warnungstyp Schweregrad Zustand
Netzkabel NormalInformativ Im Betrieb
Netzkabel Fehler Kritisch Herabgesetzt
Stromversorgung Fehler Kritisch Herabgesetzt
Redundanz (für Stromversorgungssystem) Normal Informativ Im Betrieb
Redundanz (für Stromversorgungssystem) Herabgesetzt Minder schwer Herabgesetzt
Redundanz (für Stromversorgungssystem) Verloren Schwerwiegend Herabgesetzt
Temperatur Normal Informativ Im Betrieb
Temperatur Warnung Minder schwer Herabgesetzt
Temperatur Fehler Kritisch Herabgesetzt
Thermisch Herunterfahren Kritisch Nicht betriebsbereit