Cuando hablamos de monitoreo, un elemento fundamental para determinar el correcto estado de salud o rendimiento de un dispositivo (o incluso la degradación o fallo en el mismo) es establecer un umbral, que como la palabra indica permite establecer un límite como punto de referencia.

De esta manera una herramienta de NMS como OpManager utilizando protocolos como SNMP o WMI realiza un polling (o sondeo) cada determinado tiempo y de forma configurable permite notificar una indisponibilidad, degradación o caída del dispositivo.

En teoría establecer un umbral sería una tarea tan sencilla como tomar los valores promedio de rendimiento de un dispositivo y poner un límite. Todo aquello que se salga del rango promedio generará una alerta.

Esto deja de ser una tarea sencilla cuando la cantidad de dispositivos es significativamente grande y adicionalmente, los tipos de dispositivos varían en cuanto a categorías, marcas u otros criterios, lo que convierte esta labor en algo difícil de gestionar para un administrador.

Es por esta razón que con la nueva funcionalidad de umbral adaptativo (apoyándonos en las grandes virtudes ofrecidas por el ML –Machine Learning-) nuestra herramienta de NMS pueda mantener un aprendizaje constante y automático sobre las variaciones de elementos como utilización de procesador, memoria o disco.

Sin la supervisión directa de un administrador la herramienta establece umbrales de forma automática por utilización u horario y define los picos máximos y mínimos de estos elementos, para evitar un falso positivo o la no generación de una alerta cuando debería crearse.

Todo esto es posible utilizando algoritmos predictivos avanzados y cálculos basados en porcentajes. De esta forma la herramienta se adapta rápidamente a las métricas de rendimiento en constante cambio de los dispositivos de red y pronostica valores altamente confiables para sus métricas, que luego se utilizan para establecer umbrales para los monitores de rendimiento configurados.

Para utilizar esta funcionalidad en primera instancia se debe habilitar en la plantilla correspondiente el análisis basado en umbral adaptativo.

La herramienta debe tener al menos tres días para poder aprender las variaciones que se presentan en las métricas realizando cálculos cada hora y de esta forma interpretar las variaciones. El administrador puede generar un valor base para establecer la severidad de desviación.

Ejemplo:

Para cada hora, los algoritmos predictivos de OpManager proporcionan un valor de pronóstico basado en patrones de datos y comportamiento observados previamente, y los valores de desviación configurados por el usuario se aplican en función de ese valor.

Por ejemplo, si el valor previsto para la utilización de la CPU de un dispositivo es 34 para la primera hora del día (0:00 – 1,00), entonces el valor correspondiente para generar una alerta con criticidad “Atención” sería 34+5= 39 (Pronóstico + Desvío de atención). De manera similar, los valores de los niveles ‘Problemas’ y ‘Críticos’ también se calculan cada hora.

Esta es la forma más eficiente para determinar las variaciones que se pueden llegar a presentar en una infraestructura tecnológica teniendo en cuenta la flexibilidad que entrega el análisis basado en el aprendizaje automático.

Es una excelente alternativa para que las variaciones del estado de un dispositivo en cuanto a umbrales y cambios de comportamiento, sean gestionadas por un elemento basado en inteligencia artificial.