Definiciones de tipo de suceso y condición de los componentes
Server Administrator clasifica los sucesos que afectan a determinados componentes críticos del sistema con un tipo de suceso. Normal, aviso y crítico son los tres tipos de sucesos que aparecen con mayor frecuencia para designar el estado de los componentes.
En este módulo de ayuda se definen los términos de los tipos, estados y gravedades de los sucesos. Lea este módulo de ayuda si desea obtener más información sobre los diferentes términos utilizados por Server Administrator para clasificar sucesos e identificar la condición de los componentes.
Tipos de suceso y gravedades correspondientes
Si Server Administrator notifica la condición de un componente o clasifica un suceso, los atributos para distinguir el suceso son los siguientes: el componente o la redundancia que se están supervisando y el tipo, el estado y la gravedad del suceso que está ocurriendo al componente.
Componente o redundancia
Server Administrator clasifica tanto los componentes como la redundancia de algunos componentes en función del tipo, la gravedad y el estado.
Componentes
Todos los componentes de un sistema son importantes de alguna forma. Las aplicaciones de administración de sistemas, como Server Administrator, seleccionan algunos componentes para prestarles especial atención. Los sistemas que se encuentran en buen estado dependen especialmente de un suministro continuo de alimentación eléctrica a los voltajes adecuados para poder accionar correctamente los componentes del sistema. La alimentación eléctrica se suministra a los suministros de energía del sistema a través del interruptor de corriente alterna (CA) del sistema. Los componentes de los sistemas también necesitan un rango de temperaturas de funcionamiento en el interior del chasis. Para ejecutar programas y efectuar cálculos sobre datos, se necesita una memoria de acceso aleatorio que funcione correctamente. Debido a esta necesidad, el interruptor de corriente, los suministros de energía y la memoria del sistema son algunos de los componentes más importantes supervisados por Server Administrator.
Redundancia
Server Administrator supervisa la condición de los componentes redundantes y notifica el estado de redundancia del sistema.
En función de la importancia que tenga un sistema para la finalidad de una entidad comercial u organización, algunos de los componentes del sistema se instalan en el sistema con un plan de redundancia. Es más probable que un sistema crítico para la finalidad de una organización tenga componentes redundantes. Los componentes redundantes están diseñados para asumir las funciones de un componente principal cuando este falle. La redundancia ayuda a evitar el tiempo de inactividad de un sistema derivado de apagados o daños en los componentes.
Redundancia total | La redundancia total de todo el sistema significa que todos los dispositivos funcionan dentro de los límites normales. Si un sistema necesita cuatro ventiladores para una redundancia total y los cuatro están operativos, el sistema posee redundancia total para el componente de los ventiladores. Si alguno de los dos ventiladores primarios fallara, cada uno de ellos cuenta con otro auxiliar. La redundancia total no requiere de ninguna acción a excepción del mantenimiento preventivo normal. |
---|---|
Redundancia degradada | La redundancia degradada indica que algunos de los componentes necesarios para la redundancia total no funcionan. El sistema continúa funcionando, pero no hay suficientes componentes operativos como para que uno de ellos asuma las funciones de otro en caso de fallo. Por ejemplo, si se necesitan cuatro ventiladores para conseguir una redundancia total, tres ventiladores operativos representan una redundancia degradada. Solamente uno de los dos ventiladores primarios tiene otro auxiliar en caso de fallo. |
Redundancia perdida | La redundancia perdida indica que el sistema solo tiene el número mínimo de componentes operativos para prevenir fallos del sistema. No hay componentes redundantes operativos. Si se necesitan cuatro ventiladores para una redundancia total y solo dos están operativos, ninguno de los ventiladores primarios cuenta con uno auxiliar en caso de fallo. |
Tipo
Los sucesos se clasifican por tipos. Algunos tipos de sucesos de ejemplo son normal, aviso y crítico.
Normal | Los sucesos normales indican que hay algún componente en funcionamiento con un rango de valores que le permiten cumplir su función en el sistema correctamente. Otro término con el que se denomina a menudo a aquellos componentes con estado normal es En buen estado. Si un componente está en buen estado o un suceso es normal, no es necesario que el operador del sistema tome medidas correctivas. |
---|---|
Aviso | Los sucesos de aviso se producen si algún componente administrado, a pesar de poder continuar funcionando, no lo hace de forma óptima. Los sucesos de aviso indican algún plazo a los operadores del sistema. A menudo, la acción idónea para resolver un suceso de aviso es continuar investigando y programar un mantenimiento para el componente correspondiente. Los avisos también alertan al operador del sistema de que debe prestar más atención a un componente en particular hasta que vuelva a la normalidad. Los usuarios avanzados y los administradores pueden definir los valores mínimo y máximo para un suceso de aviso. El privilegio de definir el rango de aviso permite a los usuarios avanzados y administradores especificar el tiempo de reacción que deseen aplicar a la hora de tratar con un componente operativo que empiece a mostrar signos de disminución del rendimiento. |
Crítico | Un suceso crítico indica que un componente funciona fuera de los límites operativos correctos, o bien que no está en funcionamiento. Un componente que no funcione se denomina comúnmente no recuperable. El fabricante del sistema es quien define el rango de funcionamiento crítico de un componente, ya que es el que mejor conoce la estructura del componente y las condiciones óptimas para su funcionamiento. El estado crítico tiene una connotación de mayor urgencia que el de aviso y los operadores de sistemas dan más importancia a este tipo de problema de rendimiento de los componentes. Entre las acciones adecuadas para solucionar un fallo o un estado crítico de un componente pueden estar apagar el sistema inmediatamente o concertar la sustitución de un componente en un futuro próximo. |
Estado
El estado de un componente o el atributo de un sistema pueden ser operativo, degradado o no operativo.
Operativo | Si la temperatura se considera operativa, significa que las sondas de temperatura del interior de un chasis obtienen lecturas de temperatura dentro del rango de funcionamiento normal. |
---|---|
Degraded | Si la temperatura se considera degradada, significa que las sondas de temperatura del interior de un chasis obtienen lecturas de temperatura con un valor contenido en el rango de aviso definidos por los valores de temperatura de funcionamiento máximo y mínimo configurados para un aviso. La temperatura del chasis es, bien inferior a la mínima considerada normal, bien superior a la máxima. |
No operativo | Un componente o atributo de componente considerado no operativo indica que dicho componente está funcionando, bien con un fallo, bien en un rango no operativo. Siguiendo con el ejemplo de la temperatura (y en caso de que el sistema continuara funcionando), la temperatura está tan por encima o por debajo del rango normal que puede provocar un apagado térmico del sistema; de no hacerlo, se podrían dañar o destruir algunos componentes del sistema. |
Gravedad
Cada uno de los tipos y estados de los sucesos de los componentes se evalúan en función de su gravedad. Entre las gravedades de los sucesos se incluyen informativa, leve, grave y crítica.
Informativo | Si un suceso se considera normal o el estado de un componente es operativo, la severidad correspondiente a dicho suceso normal es informativa. La única acción que realiza Server Administrator para un suceso normal es meramente informativa. Server Administrator informa al operador del sistema de que el estado del componente es normal. |
---|---|
Leve | Los sucesos de aviso pueden ser leves o críticos en función del componente. Por ejemplo, si extrae uno de los ventiladores en un sistema de ventiladores redundantes, la gravedad de dicho suceso es leve. |
Grave | Algunos sucesos de aviso pueden indicar riesgos graves para el sistema. Si un ventilador permanece fuera del sistema durante un periodo de tiempo prolongado, el suceso podría convertirse en grave, ya que la redundancia podría verse afectada. Una ausencia prolongada de uno de los componentes de un sistema cuya finalidad para la organización requiera que sea redundante puede provocar averías en componentes que no cuenten con dispositivos auxiliares y provocar, en última instancia, fallos en el sistema. |
Crítico | Los sucesos que detecten componentes dentro del rango de fallo se consideran críticos. Si se producen fallos de componentes como los ventiladores, los cables de corriente alterna o los módulos de memoria, pueden comprometer la capacidad de funcionamiento y conservación de datos del sistema. |
Relación entre el estado, la gravedad y el tipo de sucesos
En la siguiente tabla aparecen ejemplos de sucesos para componentes importantes y se indica la relación existente entre el estado, la gravedad y el tipo de un suceso.
Componente | Tipo de suceso o alerta | Gravedad | Estado |
Cable de corriente alterna | Normal | Informativo | Operativo |
Cable de corriente alterna | Fallo | Crítico | Degraded |
Fuente de alimentación | Fallo | Crítico | Degraded |
Redundancia (para el sistema de energía) | Normal | Informativo | Operativo |
Redundancia (para el sistema de energía) | Degraded | Leve | Degraded |
Redundancia (para el sistema de energía) | Perdido | Grave | Degraded |
Temperatura | Normal | Informativo | Operativo |
Temperatura | Aviso | Leve | Degraded |
Temperatura | Fallo | Crítico | Degraded |
Térmico | Apagado | Crítico | No operativo |