La surveillance des performances est une pratique essentielle de la surveillance des réseaux. Lorsque quelque chose ne va pas avec un appareil, qu’il s’agisse d’un serveur physique, d’un système de stockage en réseau ou d’un commutateur virtuel, il y a souvent des signes ou des symptômes. Ces symptômes peuvent apparaître à différents endroits et être liés à l’unité centrale, au matériel ou à l’utilisation de la bande passante. Ce n’est qu’en les repérant que vous pourrez vous rendre compte des problèmes de performance.
Par exemple, une utilisation inexplicablement élevée de l’unité centrale d’un serveur lame IBM peut être attribuée à un refroidissement inefficace de son châssis. Un serveur virtuel IBM power souffrant d’une latence élevée peut être causé par des machines virtuelles zombies qui provoquent un étalement virtuel dans son serveur hôte.
Sans un contrôle adéquat des performances, vous ne pouvez voir aucun des symptômes d’un problème imminent. Ils peuvent faire boule de neige et se transformer en un problème majeur, qui peut entraîner l’interruption de vos services. Dans ce blog, nous vous expliquerons comment OpManager de ManageEngine peut vous aider à éviter cela, en prenant pour exemple le contrôle des performances d’IBM.
IBM : Une solution pour chaque problème
Pourquoi IBM ? Ses solutions sont parmi les plus populaires et les serveurs lames, les serveurs Power et le logiciel serveur AIX d’IBM, en particulier, sont utilisés dans les réseaux du monde entier. IBM est l’un des cinq premiers fournisseurs en termes de parts de marché dans plusieurs segments et sa présence sur le marché remonte à plus de 100 ans. Elle figure parmi les cinq premiers fournisseurs en termes de parts de marché pour les serveurs et les dispositifs de stockage.
IBM propose des solutions informatiques dans les catégories suivantes :
-
Serveurs
-
Virtualisation
-
Périphériques de stockage
-
Routeurs et commutateurs
-
Équilibreurs de charge et imprimantes
-
Infrastructure d’application
-
Logiciel en tant que service
IBM a également soutenu la recherche dans les nouvelles technologies, en encourageant ces dernières années les études sur les solutions open source, l’informatique quantique et les modèles de langage.
Surveillance des performances d’IBM avec OpManager
OpManager améliore le contrôle des performances d’IBM grâce à ses moniteurs de performances spécifiques aux fournisseurs. OpManager dispose de moniteurs de performance généraux pour toutes sortes de fournisseurs et de types d’appareils, ainsi que de moniteurs spécifiques pour des fournisseurs et des types d’appareils spécifiques. Les moniteurs spécifiques sont généralement plus précis.
Mais tout d’abord, examinons le terme “moniteur de performance”. À quoi fait-il référence ?
D’une manière générale, un moniteur de performances est un outil que vous pouvez utiliser pour obtenir une mesure des performances d’un appareil. Un moniteur d’utilisation du processeur IBM vous fournira l’utilisation du processeur d’un périphérique IBM à un intervalle spécifié, par exemple une minute.
Les moniteurs de performance ont un identifiant d’objet (OID) unique spécifié par le fournisseur. OpManager utilise ces OID pour collecter ces mesures et vous les montrer. Des protocoles tels que SNMP et WMI sont utilisés pour obtenir ces informations. La configuration de ces OID et de ces moniteurs semble être un travail difficile, n’est-ce pas ? OpManager dispose de plus de 10.000 modèles de dispositifs avec des OIDs spécifiés pour chaque type de dispositif prêt à l’emploi, y compris plus de 50 modèles de dispositifs IBM pour le contrôle de la performance IBM.
Indicateurs de performance IBM que vous pouvez surveiller avec OpManager
OpManager offre une grande variété de types de moniteurs de performance IBM. En voici quelques-uns :
Surveillance du trafic : OpManager peut surveiller le trafic entrant, le trafic sortant et l’utilisation du trafic par interface pour les appareils IBM. Il vous permet également de surveiller les sessions réseau comme le nombre de ports TCP en état d’écoute, ce qui permet de détecter des modèles de trafic anormaux et de planifier l’utilisation de la bande passante afin d’éviter la surutilisation.
Surveillance du matériel : La surveillance de l’état du matériel vous aide à prévenir les problèmes imprévus qui peuvent survenir sur vos appareils. Ceci est particulièrement important pour les assemblages à haute densité tels que les racks de serveurs et de stockage qui génèrent une grande quantité de chaleur lors de leur fonctionnement. OpManager peut surveiller les mesures matérielles telles que la température des différents composants, la vitesse des ventilateurs, l’état de santé du châssis et la tension des blocs d’alimentation.
OpManager prend également en charge la surveillance de l’alimentation sans interruption (ASI) pour les dispositifs ASI qui fournissent des redondances d’alimentation aux ensembles de serveurs.
Surveillance des performances de l’unité centrale : Il est primordial d’assurer la bonne santé de l’unité centrale. Pour ce faire, il est nécessaire d’avoir une visibilité sur les différents cœurs et composants de l’unité centrale. Avec OpManager, vous pouvez surveiller les indicateurs de performance de l’unité centrale comme l’utilisation de l’unité centrale, l’utilisation de la mémoire, la vitesse d’horloge du processeur, la largeur des données de la mémoire et la température de l’unité centrale. Des données en temps réel peuvent être obtenues avec des intervalles aussi faibles que 10 secondes pour une surveillance proactive.
Indicateurs de santé généraux : Outre les indicateurs relatifs au processeur, au matériel et au trafic, OpManager peut également aider à surveiller les performances d’IBM à l’aide d’indicateurs de santé tels que les échecs et les réussites des auto-tests, les échecs de maintenance, le temps de fonctionnement total et le temps écoulé depuis la dernière maintenance. Vous pouvez définir des alertes pour ces moniteurs afin d’être averti lorsque votre appareil IBM est en mauvaise santé.
Surveillance des serveurs lames IBM : Surveillez les performances de vos serveurs lames IBM en gardant un œil sur l’état de santé du système, l’état de l’alimentation, la température, la vitesse du ventilateur, l’état de santé de chaque module et d’autres mesures pertinentes.
Surveillance des performances de stockage : OpManager vous aide également à suivre les périphériques de stockage IBM, y compris les modules flash IBM, les RAID, les bibliothèques de bandes, etc. Vous pouvez utiliser OpManager pour surveiller la santé des dispositifs de stockage, l’utilisation du stockage et les prévisions de stockage pour la planification de la capacité.
Alertes pour renforcer la surveillance des performances d’IBM
Les alertes rapides vous permettent de tirer le meilleur parti des moniteurs de performance. Les alertes doivent présenter trois caractéristiques : Premièrement, elles doivent fournir des informations sur la situation. Cela vous permet de commencer à résoudre le problème immédiatement. Deuxièmement, il convient d’éviter les inondations d’alertes et les faux positifs, car ils empêchent de détecter les problèmes réels. Enfin, les alertes doivent proposer des options qui peuvent être suivies d’actions.
Voyons si OpManager peut satisfaire à ces trois conditions.
Tout d’abord, les alertes peuvent être codées par couleur avec cinq niveaux de gravité différents : attention, problème, critique, service en panne et clair. De plus, OpManager fournit des informations de base sur la nature d’un problème lorsqu’il génère des alertes.
Pour éviter les inondations d’alertes et les faux positifs, vous avez la possibilité d’activer des seuils adaptatifs. Les seuils adaptatifs sont définis sur la base de trois jours de données du réseau. Les jours où l’activité du réseau est faible, le seuil lui-même sera bas, et vice versa.
Vous pouvez également effectuer des actions sur les alarmes, telles que définir un profil d’escalade, déclencher un flux de travail automatisé, gérer l’appareil à distance, effectuer une analyse des causes primaires, etc.
Quel que soit le problème de performance de votre appareil IBM, OpManager le surveillera, le détectera et vous alertera.
Comment une gouvernance complète avec OpManager élimine les problèmes de performance d’IBM
Avec OpManager, vous pouvez surveiller les performances de votre infrastructure IBM et être alerté en cas d’anomalie. En détectant et en traitant les problèmes de manière proactive, vous pouvez éviter les baisses de qualité, les pannes et d’autres scénarios indésirables.
Prenons un exemple. Supposons qu’un service important soit hébergé sur un rack de serveurs IBM. Le système de refroidissement dispose d’une unité d’alimentation séparée du reste de l’ensemble, une coupure de courant se produit et votre alimentation de secours prend le relais, mais l’alimentation de secours du système de refroidissement tombe en panne. Avec un outil normal de contrôle des performances, vous ne serez informé de certains de ces problèmes que lorsque vos clients se plaindront de l’interruption du service.
Mais avec OpManager, vous recevrez des alertes sur l’augmentation de la température des serveurs et sur la défaillance de l’alimentation du système de refroidissement, et ce, de manière proactive. Avant que votre service ne tombe en panne et que vos clients ne soient affectés, vous pouvez résoudre le problème.
Qu’il s’agisse de la surveillance des performances d’IBM ou de tout autre dispositif ou fournisseur, OpManager vous couvre. Vous avez encore des doutes ? Pourquoi ne pas vous rendre compte par vous-même grâce à notre essai gratuit de 30 jours ? Vous pouvez également planifier une démonstration gratuite et personnalisée pour voir comment OpManager s’intègre dans votre réseau.
Source : IBM performance monitoring with OpManager: How governance eliminates outages by Visakh P S