Définitions de type d'événement et intégrité des composants
Server Administrator classifie les événements qui affectent certains composants critiques de votre système à l'aide de types d'événements. Les trois types les plus courants de types d'événement affichés pour l'état des composants sont Normal, Avertissement et Critique.
Ce module d'aide définit les termes relatifs aux types d'événements, aux états et aux gravités. Consultez-le si vous souhaitez davantage d'informations sur la terminologie que Server Administrator applique pour classifier les événements et identifier l'intégrité des composants.
Types d'événements et gravités associées
Si Server Administrator signale l'intégrité d'un composant ou classifie un événement, les attributs distinctifs de l'événement sont les suivants : composant ou redondance surveillé(e) et type, état et gravité de l'événement qui se produit dans le composant.
Composant ou redondance
Server Administrator classifie les composants et la redondance de certains composants par type, gravité et état.
Composants
Tous les composants d'un système sont importants, d'une façon ou d'une autre. Les applications de gestion de systèmes telles que Server Administrator portent une attention particulière à certains composants. L'intégrité des systèmes repose en particulier sur une alimentation électrique stable avec une tension appropriée, pour un fonctionnement correct des composants système. L'alimentation électrique est fournie via le commutateur CA (courant alternatif) du système, dans les blocs d'alimentation. Les composants des systèmes nécessitent également une plage de températures de fonctionnement particulière dans le châssis. L'exécution des programmes et des calculs sur les données exigent une mémoire RAM en bon état de fonctionnement. En raison de ces exigences, le commutateur d'alimentation, les blocs d'alimentation, les ventilateurs et la mémoire système font partie des composants les plus importants surveillés par Server Administrator.
Redondance
Server Administrator surveille l'intégrité des composants redondants et émet un rapport sur l'état de redondance du système.
Selon l'importance d'un système pour les activités d'une entité commerciale ou d'une organisation, certains composants système sont installés dans le système avec une redondance planifiée. Un système essentiel aux activités d'une organisation comportera probablement des composants redondants. Le composant redondant est conçu pour prendre le relais en cas de panne de son composant compagnon. La redondance permet de protéger le système des temps d'inactivités dus aux arrêts ou dommages des composants.
Redondance totale | La redondance totale pour l'ensemble du système signifie que tous les périphériques fonctionnent dans les limites normales. Si un système nécessite quatre ventilateurs pour la redondance totale et que les quatre fonctionnent, la redondance complète est bien établie pour le composant ventilateur. Si l'un des deux ventilateurs principaux est en panne, chacun dispose d'un ventilateur de secours. La redondance totale ne requiert aucune action autre que la maintenance préventive normale. |
---|---|
Dégradation de la redondance | Une dégradation de la redondance signifie que certains des composants nécessaires à la redondance totale ne fonctionnent pas. Le système fonctionne, mais le nombre de composants en état de fonctionnement est insuffisant pour qu'un composant opérationnel prenne le relais en cas de panne d'un composant. Par exemple, si la redondance totale nécessite quatre ventilateurs, trois ventilateurs opérationnels constituent une situation de dégradation de redondance. Seul l'un des deux ventilateurs principaux dispose d'un ventilateur de secours en cas de panne. |
Perte de la redondance | Une perte de redondance signifie que le système comporte uniquement le nombre minimal de composants nécessaire pour éviter la panne. Aucun composant redondant ne fonctionne. Si la redondance totale nécessite quatre ventilateurs et que seulement deux d'entre eux sont opérationnels, aucun des deux ventilateurs principaux ne dispose de ventilateur de secours en cas de panne. |
Type
Un événement est classé par type. Par exemple : normal, avertissement et critique.
Normal | Les événements de type Normal indiquent qu'un composant fonctionne dans la plage de valeurs qui lui permet d'assurer correctement son rôle dans le système. L'autre terme souvent associé aux composants dont l'état est normal est OK. Si le composant est OK ou si l'événement est de type Normal, l'opérateur système n'a besoin d'appliquer aucune action corrective. |
---|---|
Avertissement | Les événements de type Avertissement se produisent lorsqu'un composant géré ne fonctionne pas normalement, mais qu'il parvient quand même à fonctionner. Les événements de type Avertissement offrent un délai aux opérateurs système. L'action appropriée, en cas d'avertissement, consiste généralement à examiner plus précisément l'incident et à planifier la maintenance du composant. Les avertissements alertent également l'opérateur système afin qu'il prête davantage attention à un composant jusqu'à ce que ce dernier revienne à la normale. Les utilisateurs privilégiés et les administrateurs peuvent définir les valeurs minimale et maximale d'un événement de type Avertissement. Le privilège de définition de la plage d'avertissement permet à ces utilisateurs de déterminer le temps de réaction à appliquer lorsqu'un composant opérationnel montre des signes de dégradation des performances. |
Critique | Un événement critique signale qu'un composant fonctionne hors des limites de fonctionnement normal ou qu'il ne fonctionne pas du tout. Un composant qui ne fonctionne pas est souvent déclaré irrécupérable. Le fabricant du système détermine la plage critique d'un composant, car il est celui qui connaît le mieux la conception de ce composant et son fonctionnement correct. Le terme Critique implique une urgence plus importante que dans le cas d'un avertissement. Les opérateurs système accordent davantage d'attention à ce type de dégradation des performances des composants. Les actions pertinentes face à un composant défectueux ou à l'état Critique sont notamment l'arrêt immédiat du système ou le remplacement rapide du composant concerné. |
État
État d'un composant ou d'un attribut système : Opérationnel, Dégradé ou Non opérationnel.
Opérationnel | Une température opérationnelle signifie que les capteurs de températures à l'intérieur d'un châssis mesurent des températures qui se situent dans la plage normale de fonctionnement. |
---|---|
Dégradé | Une température dégradée signifie que les capteurs de températures d'un châssis relèvent des températures figurant dans la plage d'avertissement définie par les températures minimale et maximale de fonctionnement requises pour l'avertissement. La température du châssis est soit au-dessous du minimum normal, soit au-dessus du maximum normal. |
Non opérationnel | Un composant ou attribut de composant non opérationnel signifie soit que le composant a échoué, soit qu'il fonctionne dans la plage irrécupérable. D'après cet exemple de température, si le système fonctionne toujours, la température est tellement au-dessus du maximum ou au-dessous du minimum que cela peut provoquer un arrêt thermique du système ou une température susceptible d'endommager ou de détruire des composants système. |
Gravité
Chaque type d'événement et état d'un composant est classé selon sa gravité. Les gravités des événements sont notamment Informatif, Secondaire, Principal et Critique.
Informatif | Tout événement ou état de composant Normal correspond à un état opérationnel. Il est associé à la gravité Informatif. La seule action que Server Administrator applique à un événement de type Normal est Informatif. Server Administrator prévient l'opérateur système que le composant est normal. |
---|---|
Secondaire | Un événement Avertissement peut être secondaire ou critique, selon le composant. Par exemple, si vous supprimez un ventilateur dans un système avec ventilateurs redondants, la gravité de cet événement est Secondaire. |
Principal | Certains événements d'avertissement peuvent signaler des risques majeurs pour le système. Un ventilateur restant hors du système pendant une période prolongée peut provoquer un événement majeur, car la redondance est compromise. L'absence prolongée d'un composant dans un système dont les activités dans l'organisation nécessitent une redondance peut provoquer des pannes de composants dépourvus d'éléments de secours. Cela peut conduire à une panne du système. |
Critique | Les événements qui détectent des composants dans la plage d'échec sont de type Critique. La panne d'un composant tel qu'un ventilateur, un cordon d'alimentation CA ou un module de mémoire peut empêcher le système de fonctionner et de préserver les données. |
Relation entre type d'événement, gravité et état
Le tableau suivant fournit un exemple d'événement pour des composants importants et montre les relations entre le type d'événement, la gravité et l'état.
Composant | Type d'événement ou d'alerte | Gravité | État |
Cordon d'alimentation | Normal | Informatif | Opérationnel |
Cordon d'alimentation | Panne | Critique | Dégradé |
Alimentation électrique | Panne | Critique | Dégradé |
Redondance (du système d'alimentation) | Normal | Informatif | Opérationnel |
Redondance (du système d'alimentation) | Dégradé | Secondaire | Dégradé |
Redondance (du système d'alimentation) | Perdue | Principal | Dégradé |
Température | Normal | Informatif | Opérationnel |
Température | Avertissement | Secondaire | Dégradé |
Température | Panne | Critique | Dégradé |
Thermique | Arrêt | Critique | Non opérationnel |