Apache Cassandra est largement utilisé par les organisations pour son évolutivité et sa flexibilité. Sa capacité à gérer de grandes quantités de données non structurées et sa fonctionnalité de basculement à zéro en ont fait le serveur de base de données préféré des organisations informatiques. Mais aussi fonctionnelle soit-elle, cette base de données s’accompagne d’une grande complexité architecturale. Un seul point faible peut entraîner des temps d’arrêt inattendus ou, pire encore, le plantage d’une application. Pour débloquer une opérabilité transparente avec Apache Cassandra, les administrateurs doivent garder une longueur d’avance en observant le comportement de l’infrastructure.

Voici quelques challenges que vous pourriez rencontrer lors de la surveillance d’Apache Cassandra et des conseils pour les surmonter avec une solution de surveillance adaptée.

Problème 1 : Difficulté à diagnostiquer les problèmes de performance

L’architecture à nœuds identiques d’Apache Cassandra rend difficile le diagnostic d’un problème existant. De nombreux clusters et leurs répliques contenant de gros paquets de données utilisent un grand nombre de nœuds, ce qui accroît la complexité de l’infrastructure.

La solution : Une surveillance complète

Les administrateurs doivent suivre chaque cluster et leurs nœuds respectifs en temps réel. En obtenant des informations détaillées sur le comportement et les performances de chaque élément de l’infrastructure, l’équipe informatique peut être alertée des problèmes qui surviennent. L’interface de la solution doit pouvoir fournir des informations sur les délais d’attente, la latence, les statistiques des tables de mémoire et l’allocation de la mémoire. Les administrateurs de bases de données doivent également pouvoir obtenir des mises à jour en temps réel sur les tâches en cours et terminées afin d’étudier et de résoudre les problèmes qui ralentissent la base de données.

Problème 2 : Trop d’indicateurs de performance clés

Apache Cassandra est connu pour ses composants disparates, chacun d’entre eux ayant des attributs et des indicateurs de performance clés uniques. Les mesures de surveillance de Cassandra, telles que la latence de lecture et d’écriture, le facteur de réplication, le débit et l’utilisation du disque, indiquent les performances de la base de données et le pourcentage d’espace et de mémoire occupé dans chaque nœud d’un cluster. Le suivi des erreurs, des exceptions et des dépassements permet aux administrateurs d’être alertés en cas de situations critiques telles que les pannes. Le suivi de la collecte des déchets aide les administrateurs à gérer efficacement la mémoire. Mais l’étude de toutes les mesures pour chaque nœud de la base de données, la hiérarchisation des fonctionnalités, l’évitement des rapports de données non pertinents et l’analyse du comportement deviennent une charge considérable pour les administrateurs de bases de données.

La solution : Rapports élaborés

L’utilisation d’un outil de surveillance Apache Cassandra capable d’établir des rapports sur les indicateurs clés de performance de tout élément donné en temps réel, ainsi que sur les données de pronostic de l’élément, permet aux administrateurs d’identifier facilement les anomalies de performance et d’analyser le comportement de la base de données. Mais étant donné le grand nombre d’éléments dans la base de données, la solution devrait également être capable de résumer et d’agréger les valeurs KPI pour aider les administrateurs à comprendre les tendances de performance et à se concentrer sur les clusters qui nécessitent plus d’attention. L’interface de la solution doit être personnalisable, ce qui permet aux administrateurs de choisir et de hiérarchiser les éléments sur lesquels ils veulent en savoir plus.

Problème 3 : Taille de l’infrastructure

L’évolutivité d’Apache Cassandra permet aux entreprises de traiter d’énormes quantités de données, qu’il est généralement impossible de surveiller à l’aide d’une interface en ligne de commande ou d’une solution de surveillance qui ne peut prendre en charge qu’un nombre limité d’instances. Les administrateurs de bases de données ne peuvent pas changer de solution de surveillance au fur et à mesure que leur système informatique évolue. En outre, l’architecture dynamique du serveur contribue à l’évolution des fonctionnalités des applications. Les valeurs seuils des attributs assignés aux applications varient rapidement avec le temps, ce qui augmente les fausses alertes et le bruit des alertes lorsqu’elles ne sont pas optimisées en temps réel. Cette situation laisse souvent les administrateurs perplexes lorsqu’ils tentent de hiérarchiser la gravité des problèmes.

La solution : Une interface de surveillance intelligente et évolutive

Tout comme l’infrastructure, la solution de surveillance qui la contrôle doit être évolutive. Elle doit pouvoir prendre en charge le nombre d’instances requis et être robuste. Elle doit être dotée d’un système d’alerte intelligent capable d’actualiser automatiquement les seuils dynamiques, de définir des niveaux de gravité et d’automatiser les actions réactives et l’escalade, afin d’aider les administrateurs à réduire le nombre d’alertes. Les administrateurs devraient disposer d’une interface semblable à un tableau de bord centralisé de surveillance de Cassandra qui pourrait étendre sa vue et ses capacités avec la croissance de l’infrastructure, y compris une vue détaillée mais rapide des alertes, des escalades et des niveaux de gravité.

Problème 4 : Planification de la capacité

La mise à niveau de la base de données Apache Cassandra implique des analyses au niveau cellulaire pour l’ajout de nœuds, l’allocation de stockage et l’affectation des ressources. Les administrateurs doivent étudier les tendances en matière de performances, les analyser et parvenir à un terrain d’entente qui garantisse l’efficacité du système et la rentabilité. Compte tenu de la complexité de l’infrastructure d’Apache Cassandra, il est pratiquement impossible d’effectuer manuellement de telles analyses.

La solution : Prévisions de performances et rapports exploitables

La solution de surveillance doit être capable de suivre chaque élément de l’écosystème, d’étudier les courbes de performance et de prévoir leurs performances. Avec une prévision précise en main, les administrateurs peuvent avoir une estimation précise de la capacité et des besoins en ressources. Cela les aide à fournir la base de données de manière efficace, sans compromis sur les ressources ou les coûts.

Comment Applications Manager peut-il vous aider ?

ManageEngine Applications Manager est conçu pour surveiller les écosystèmes informatiques de toutes tailles et de toutes complexités, sans coûts cachés ni plans de licence onéreux. L’interface de surveillance centralisée de la solution vous aidera à surveiller les bases de données Apache Cassandra en même temps que le reste de votre système informatique. Applications Manager remplit toutes les conditions requises pour surveiller les applications à fort trafic, que ce soit sur site ou dans le cloud.

Vous êtes intéressé ? Planifiez une démonstration avec l’un de nos experts ou téléchargez une version d’essai gratuite de 30 jours pour voir comment Applications Manager peut améliorer l’informatique de votre organisation.

Source : Apache Cassandra monitoring: Challenges and solutions rédigé par Sujitha Paduchuri