El monitoreo del rendimiento es una práctica esencial en la gestión de redes. Cuando algo sale mal con un dispositivo ―ya sea un servidor físico, un sistema de almacenamiento de red o un switch virtual―, a menudo hay síntomas. Estos pueden aparecer en varios lugares y estar relacionados con la CPU, el hardware o el uso del ancho de banda. Estos problemas solo se pueden detectar si se supervisan dichos síntomas.
Por ejemplo, una utilización inexplicablemente alta de la CPU para un servidor IBM blade puede atribuirse a la refrigeración ineficiente de su unidad de chasis. Un servidor virtual IBM power que sufre de alta latencia puede deberse a equipos virtuales zombis que causan una proliferación virtual en su servidor host.
Sin un monitoreo adecuado del rendimiento, no puede ver los síntomas de un problema inminente. Pueden crecer hasta convertirse en algo importante y afectar sus servicios. En este blog, le diremos cómo ManageEngine OpManager puede ayudar a prevenir esto haciendo referencia al monitoreo del rendimiento de IBM como ejemplo.
IBM: una solución para cada problema
¿Por qué IBM? Sus soluciones se encuentran entre las más populares. Los servidores blade, los servidores power y el software de servidor AIX de IBM se utilizan en redes de todo el mundo. Su presencia en el mercado se remonta a más de 100 años. Hoy en día se encuentra entre los cinco principales proveedores en términos de cuota de mercado para servidores y dispositivos de almacenamiento.
IBM ofrece soluciones de productos de TI en las siguientes categorías:
∙ Servidores
∙ Virtualización
∙ Dispositivos de almacenamiento
∙ Routers y switches
∙ Equilibradores de carga e impresoras
∙ Infraestructura de aplicaciones
∙ Software como servicio
IBM también ha sido un defensor de la investigación en nuevas tecnologías promoviendo estudios en soluciones de código abierto, computación cuántica y modelos de lenguaje en los últimos años.
Monitoreo del rendimiento de IBM con OpManager
OpManager mejora el monitoreo del rendimiento de IBM con sus monitores de rendimiento específicos del proveedor. OpManager tiene monitores específicos y de rendimiento general para todo tipo de proveedores y dispositivos. Los específicos suelen ser más precisos.
Demos un vistazo al término “monitor de rendimiento”.
En términos generales, un monitor de rendimiento es algo que puede aplicar para obtener una métrica de rendimiento de un dispositivo. Un monitor de utilización de CPU de IBM le proporcionará la utilización de CPU para un dispositivo IBM en un intervalo fijo, como un minuto.
Los monitores de rendimiento tienen un identificador de objeto (OID) único especificado por el proveedor. OpManager utiliza estos OID para recopilar estas métricas y mostrárselas. Para obtener esta información, protocolos como SNMP y WMI son utilizados. Configurar estos OID y monitores suena como un trabajo duro, ¿no es así? OpManager cuenta con más de 10.000 plantillas de dispositivos con OID especificados para cada tipo de dispositivo out-of-the-box. Esto incluye más de 50 plantillas de dispositivos IBM para el monitoreo del rendimiento de IBM.
Métricas de rendimiento de IBM que puede monitorear con OpManager
OpManager cuenta con una amplia variedad de tipos de monitores de rendimiento de IBM. Aquí están algunos de ellos:
Monitoreo del tráfico. OpManager puede monitorear el tráfico entrante, el tráfico saliente y la utilización del tráfico por interfaz para dispositivos IBM. También le permite monitorear sesiones de red, tales como el número de puertos TCP en estado de escucha. Esto ayuda a detectar patrones de tráfico anormales y planificar la utilización del ancho de banda para evitar el uso excesivo.
Monitoreo del hardware. Monitorear el estado del hardware le ayuda a evitar errores imprevistos que pueden ocurrir en sus dispositivos. Esto es particularmente importante para los ensamblajes de alta densidad, como los bastidores de servidores y almacenamiento. Estos generan una gran cantidad de calor durante su funcionamiento. OpManager puede monitorear métricas de hardware como la temperatura de varios componentes del dispositivo, la velocidad del ventilador en rpm, el estado del chasis y el voltaje de las unidades de fuente de alimentación.
OpManager también admite el monitoreo de sistemas de alimentación ininterrumpida (UPS) para dispositivos UPS que proporcionan redundancias de energía a conjuntos de servidores.
Monitoreo del rendimiento de CPU. Garantizar un buen estado de la CPU es primordial. Necesita visibilidad de los diferentes núcleos y componentes de la CPU para lograrlo. Con OpManager, puede monitorear los indicadores de rendimiento de CPU: el uso de la CPU, el uso de la memoria, la velocidad del reloj del procesador, el ancho de datos de la memoria y la temperatura de la CPU. Se pueden obtener datos en tiempo real con intervalos de hasta 10 segundos para un monitoreo proactivo.
Indicadores generales de salud. Además de los indicadores de CPU, hardware y tráfico, OpManager también puede ayudar a monitorear el rendimiento de IBM utilizando los siguientes monitores de estado: fallos y éxitos de autocomprobación, mantenimientos fallidos, tiempo de actividad total, y tiempo transcurrido desde el último mantenimiento. Puede establecer alertas para estos monitores para que se le notifique cuando su dispositivo IBM tenga un mal estado.
Monitoreo de IBM blade. Monitoree el rendimiento de sus servidores IBM blade controlando el estado del sistema, el estado de la energía, la temperatura, la velocidad del ventilador, el estado de salud de cada módulo y otras métricas relevantes.
Monitores de rendimiento de almacenamiento. OpManager también le ayuda a supervisar los dispositivos de almacenamiento de IBM. Esto incluye los módulos flash de IBM, RAID, las bibliotecas de cintas y más. Puede utilizar OpManager para monitorear el estado de los dispositivos de almacenamiento y el uso del almacenamiento, además de prever el almacenamiento para la planificación de la capacidad.
Alertas para complementar el monitoreo del rendimiento de IBM
Las alertas emergentes le permiten aprovechar al máximo los monitores de rendimiento. Las alertas deben tener tres características. En primer lugar, deben transmitir información sobre la situación. Esto le ayuda a comenzar a solucionar el problema de inmediato. En segundo lugar, se deben evitar las inundaciones de alertas y los falsos positivos. Estos obstaculizan la detección de problemas reales. En tercer lugar, las alertas deben proporcionar opciones que pueden ir seguidas de acciones.
Veamos si OpManager puede satisfacer las tres condiciones.
En primer lugar, las alertas se pueden codificar por colores con cinco niveles de gravedad diferentes: atención, problema, crítico, servicio inactivo y sin incidentes. Además, OpManager proporciona información básica sobre la naturaleza de un problema cuando genera alertas.
Para evitar inundaciones de alertas y falsos positivos, tiene la opción de habilitar umbrales adaptativos. Estos se establecen utilizando tres días de datos de la red. En los días de baja actividad, el umbral en sí será bajo y viceversa.
También puede realizar acciones en las alarmas. Estas incluyen configurar un perfil de escalamiento de alarmas, activar un flujo de trabajo automatizado, gestionar el dispositivo de forma remota, ejecutar un análisis de causa raíz, etc.
Lo que sea que esté mal con el rendimiento de su dispositivo IBM, OpManager lo puede monitorear, detectar y avisarle.
Cómo la gobernanza completa con OpManager elimina los problemas de rendimiento de IBM
Con OpManager, puede monitorear el rendimiento de su infraestructura IBM y recibir alertas sobre cualquier discrepancia. Al detectar y abordar problemas de forma proactiva, puede evitar reducciones en la calidad, interrupciones y otros escenarios no deseados.
Veamos un ejemplo. Digamos que tiene un servicio importante alojado en un rack de servidores IBM. El sistema de refrigeración tiene una unidad de alimentación independiente del resto del conjunto. Entonces se produce un corte de energía. Su reserva de energía toma el control, pero el sistema de refrigeración falla. Si usa una herramienta normal de monitoreo de rendimiento, solo sabrá sobre algunos de estos problemas cuando sus clientes se quejen de que el servicio está caído.
Con OpManager, recibirá proactivamente alertas sobre el aumento de la temperatura del servidor y la caída de la fuente de alimentación de refrigeración. Puede solucionar el problema antes de que el servicio se vea interrumpido y sus clientes se vean afectados.
Ya sea que se trate del monitoreo del rendimiento de IBM o cualquier otro dispositivo o proveedor, OpManager lo tiene cubierto. ¿Todavía tiene dudas? ¿Por qué no lo comprueba por su cuenta con nuestra prueba gratis por 30 días? También puede programar una demostración personalizada gratis para ver cómo OpManager encaja en su red.