O AWS ELB distribui dinamicamente o tráfego de entrada de aplicações em várias instâncias do EC2 e dimensiona os recursos para atender aos requisitos de tráfego. O Elastic Load Balancer ajuda a otimizar o desempenho de vários aplicativos móveis e da Web, identificando instâncias do EC2 com falhas antes que elas afetem a experiência do usuário final.

Por que é importante monitorar o AWS ELB?

Várias empresas empregam o ELB para tornar suas aplicações altamente dimensionáveis e disponíveis. No entanto, problemas no ELB podem prejudicar as operações críticas de negócios na aplicação e podem fazer com que  fique inativo, resultando em queda na receita, na satisfação do cliente e na confiança em sua marca. É essencial monitorar proativamente o desempenho do ELB para detectar e resolver possíveis problemas que possam ocorrer no balanceador de carga.

Alguns problemas comuns encontrados no ELB são:

  • Falhas nas instâncias do EC2

  • Latência

  • Erros de rede/conexão

O acompanhamento do desempenho do balanceador de carga em tempo real ajuda a detectar e gerenciar facilmente esses problemas. O Applications Manager oferece monitoramento proativo do AWS ELB que ajuda a identificar problemas no AWS Elastic Application Load Balancer e no Network Load Balancer, além de oferecer ações corretivas automatizadas para resolvê-los.

O Applications Manager também ajuda você a definir limites para métricas importantes do AWS ELB e o notifica sobre violações acionando um alarme. Por exemplo, um alerta sobre o aumento da carga de uma instância do EC2 pode avisá-lo para provisionar seus recursos adequadamente.

Neste artigo, daremos uma olhada nas métricas importantes que precisam ser levadas em conta ao monitorar os serviços do AWS ELB.

Latência 

Essa é a métrica mais importante, que lhe dá uma visão geral do desempenho da sua aplicação. A latência é o tempo decorrido, em segundos, entre o momento em que a solicitação sai do balanceador de carga e o recebimento de uma resposta da instância de destino/backend.

O Applications Manager rastreia a latência média de suas aplicações. Se esse valor for alto, talvez seja necessário analisar o que está fazendo com que as instâncias de backend forneçam respostas atrasadas.

O mais provável é que seja um problema na rede, uma configuração ruim ou uma instância sobrecarregada. Em seguida, você pode analisar esses problemas e corrigi-los para melhorar a capacidade de resposta do aplicativo.

Gráfico demonstrativo com média da latência com faixa azul.

Hosts saudáveis e não saudáveis 

O AWS ELB tem vários sistemas/hosts de destino que atendem às solicitações de entrada. É importante ficar de olho na contagem de hosts saudáveis e não saudáveis, pois, é claro, ter mais instâncias saudáveis garante melhor desempenho de suas aplicações.

O Applications Manager monitora a Healthy Host Count e a UnHealthy Host Count. Isso o ajuda a garantir que um número adequado de hosts íntegros esteja sempre disponível para atender a todas as solicitações recebidas sem perdê-las.

Gráfico de barras nas cores verdes e rosa.

 

Conexões e solicitações 

Os balanceadores de carga (load balancers) contêm ouvintes que verificam se há novas conexões. Veja os três tipos:

  • Conexões ativas: O número total de conexões TCP (Transmission Control Protocol) simultâneas ativas entre clientes e o load balancer, e entre o load balancer e os alvos.

  • Conexões rejeitadas: O número de conexões que foram rejeitadas porque o load balancer atingiu seu número máximo de conexões.

  • Novas conexões: O número total de novas conexões TCP estabelecidas de clientes para o load balancer e do load balancer para os destinos.

O Applications Manager monitora a contagem de Conexões Ativas, Conexões Rejeitadas e Novas Conexões para ajudá-lo a entender a carga no balanceador.

Gráfico nas cores verde, azul e rosa demonstrando conexões.

O Applications Manager também monitora o Total Requests (total de solicitações) e o Requests/Min (solicitações/minuto). É o número de solicitações que o ELB recebeu e enviou para as instâncias registradas do EC2 durante o período de tempo selecionado (soma).

Isso o ajuda a avaliar a quantidade de tráfego que o load balancer está tratando. Se o número de solicitações continuar flutuando, talvez seja necessário verificar se há problemas de DNS. Isso também pode ajudá-lo a provisionar as instâncias que fazem o backup do balanceador de carga.

Gráfico na cor azul com números de solicitações

Erros 

Há vários tipos de erros que podem ocorrer no ELB. Os recursos de monitoramento do AWS ELB do Applications Manager incluem o monitoramento dos seguintes tipos de erros:

Erros de conexão 

São erros que ocorrem durante o estabelecimento de uma conexão. O Applications Manager monitora três métricas diferentes de erro de conexão: Erros de negociação de TLS do cliente, Erros de negociação de TLS do destino e Erros de conexão do destino.

Essas informações permitem que você tenha visibilidade do número de conexões TLS iniciadas pelo cliente que não foram estabelecidas com o load balancer, e das conexões TLS iniciadas pelo load balancer que não foram estabelecidas com o destino.

Gráfico nas cores verde, azul e rosa com os erros de conexão

Erros do load balancer 

São erros originados dos clientes e servidores no ELB.

O Applications Manager monitora os Erros do cliente ELB e os Erros do servidor ELB para avisá-lo sobre problemas nos clientes e servidores que podem ser resolvidos antes que afetem a experiência do usuário de suas aplicações.Gráfico em verde mostrando exemplo de erro

Códigos de erro 

Os códigos de status de resposta HTTP indicam se uma solicitação específica foi concluída com êxito. No ELB, diferentes tipos de códigos de erro podem ser gerados, dependendo do tipo de problema. O monitoramento e o rastreamento desses códigos de erro ajudam a identificar áreas problemáticas que degradam o desempenho do seu sistema.

O Applications Manager rastreia os erros do Target HTTP 5XX, 4XX, 3XX e 2XX, juntamente com seus respectivos grupos-alvo e outros parâmetros, como a integridade do sistema.

Todos esses erros têm seus próprios significados e causas prováveis. Os erros HTTP 5XX indicam o número de solicitações que não puderam ser gerenciadas adequadamente, enquanto os erros HTTP 4XX indicam o número de solicitações incorretas que foram enviadas ao ELB. Cada classe desses erros pode ter vários erros que podem ser causados por diversos motivos.

Por exemplo, um erro 502 indica um gateway ruim, enquanto um erro 504 indica um tempo limite do gateway. Você pode obter visibilidade da eficiência de seus servidores e instâncias de backend analisando esses erros e, assim, evitando interrupções desnecessárias.

Tabela com códigos de erros com diversos exemplos

Grupos de destino 

O ELB tem grupos de destino que encaminham solicitações para um ou mais destinos registrados. Ao criar uma regra de ouvinte, você pode especificar um grupo de destino e condições. Quando uma condição de regra é atendida, o tráfego é encaminhado para o grupo correspondente. Você pode criar diferentes grupos para diferentes tipos de solicitações.

O Applications Manager monitora todos os alvos e os grupos de alvos associados, juntamente com seus status. Isso o ajuda não só a identificar quais alvos não estão saudáveis, mas também o motivo, ajudando-o a corrigir os problemas antes que eles afetem o desempenho da aplicativo.

Você pode usar o Applications Manager para monitorar instâncias do Amazon EC2 e RDS, volumes do EBS, SNS, S3, DynamoDB, AuroraDB e serviços de faturamento do AWS juntamente com o ELB.  Além de monitorar mais de 130 tipos de aplicações, inclusive no local, virtualização, contêineres e nuvem, tudo a partir de um único console, permitindo que você obtenha visibilidade total da sua pilha.

Sobre a nossa solução 

O Applications Manager faz parte do conjunto de soluções ITOM da ManageEngine. Além do monitoramento de aplicações, o ITOM também tem soluções para otimizar o monitoramento de rede, servidores, largura de banda, configurações, a segurança e a conformidade do firewall, o gerenciamento de endereços IP e o gerenciamento de portas de switch. Na verdade, isso torna as soluções ITOM a escolha ideal para mais de 1 milhão de administradores de TI em todo o mundo.

Se você ainda não conhece o Applications Manager, comece com uma avaliação gratuita de 30 dias, clicando aqui. Ou, se preferir, você pode solicitar uma demonstração com um de nossos especialistas, clicando aqui.

Artigo original: https://blogs.manageengine.com/application-performance-2/appmanager/2020/05/28/the-essentials-of-monitoring-aws-elastic-load-balancing.html

Traduzido por: Flávia Augusto