Monitoramento de Servidores

fonte: http://www.hardware.com.br

Zabbix

Solução de monitoramento livre, licenciada pela GPL 2. É concorrente direto o Nagios. O software tem suporte a praticamente todos os sistemas operacionais e realiza relatórios gráficos, alertas por e-mail, monitoramento de ativos de rede, etc.

Nagios

O Nagios é o objeto de estudo deste documento. Sua estrutura robusta e a possibilidade de criação de funcionalidades infinitas de monitoramento, além da licença e casos de sucesso no mundo todo são fortes características para seu uso.
FAN – Fully automated Nagios
Parece simples configurar um software de monitoramento: instalar o software e apontar para as máquinas. Seria muito bom se o processo fosse fácil assim. Quem já testou aplicações de monitoramento sabe que o processo de configuração é bastante doloroso e exige muita paciência. O primeiro passo para a utilização de uma ferramenta dessas é elencar todos os serviços e servidores que serão monitorados. Sem essa listagem, qualquer configuração da ferramenta pode ser perda de tempo. Com a lista em mãos, é fácil identificar os pontos que exigem mais atenção e saber se algo foi esquecido.
Abaixo estão listados alguns exemplos de servidores em uma lista que pode ser seguida para facilitar o levantamento da estrutura que será monitorada:
Servidor
IP
Sistema operacional
Serviços e recursos monitorados
Tipo
SRV-EMAIL
192.168.0.100
Windows
Exchange, Disco C:, Disco D:
VM
SRV-ERP
192.168.0.150
Linux
Serviço do ERP
Físico
SRV-GATEWAY
192.168.0.1
Linux
Serviço do Gateway
Físico
SRV-AD
192.168.0.5
Windows
Serviço do AD
Físico
SRV-VM
192.168.0.10
Windows
Serviço do Hyper-V
Físico
É claro que o ambiente pode ser diferente, pode ter mais máquinas, utilizar outros sistemas e outras configurações, tudo depende do tamanho e da complexidade do ambiente.
O Nagios é uma ferramenta sensacional em termos de monitoramento, isso é inegável. O que poucos estão cientes é a complexidade da configuração do software. A estrutura de arquivos do Nagios é muito bem estruturada e bem definida, para um utilizador experiente. Para um novato, é frustrante tentar configurar qualquer coisa a ser monitorada. Mas até para este problema existe uma grande solução: o FAN.
Com esta suíte, os problemas com as configurações e instalações são minimizados. Pode-se ter um sistema completo de monitoramento, pronto para ser usado em menos de uma hora. É necessário apenas ter a imagem do sistema e um CD-ROM para gravar. Atualmente encontra-se na versão 2.2 e é disponível para sistemas x86 ou 64 bits. O download é gratuito no site do projeto. O FAN é baseado na distribuição CentOS, ou seja, tudo o que é valido para o CentOS é valido também para o FAN.
Veja os principais aplicativos disponibilizados no FAN:
  • Nagios
O Nagios Core, ou núcleo do Nagios está presente no FAN.
  • Nagios Plugins
Diversos Plugins de checagem, notificação e demais estão instalados e prontos para serem utilizados
  • NagVis
A ferramenta de visualização gráfica dos dados do Nagios. Este software encontra-se configurada e pronta pra ser usada.
  • NDOUtils
Complemento responsável por armazenar os dados de monitoramento em um banco de dados. É a melhor maneira de recuperar os dados para futuras análises.
  • NaReTo (Nagios Reporting Tool)
Ferramenta auxiliar que gera relatórios com os dados armazenados do Nagios. Muito útil para análise de dados. Os relatórios de disponibilidade poderão ser utilizados para que seja feita uma analise detalhada dos serviços que são prestados, identificando pontos de falha e de melhoria. 
  • Centreon
Ferramenta de configuração gráfica do Nagios. Todos os serviços, hosts e notificações podem ser configurados por esta aplicação, evitando o uso e edição de arquivos de configuração.
  • Wiki
Ferramenta de documentação do FAN.
O FAN pode ser baixado através do site do projeto, em http://www.fullyautomatednagios.org/
Para seu uso, basta gravar a imagem em um CD-ROM e realizar a instalação em um computador inicializado com o mesmo. Caso você não esteja realmente certo do uso do software, é disponibilizada uma área em que podemos realizar o test-drive do FAN. Para isso, entre no site do projeto e selecione DEMO. Você poderá testar todas as funcionalidades dos softwares.

Adicionando Hosts

A configuração de hosts no FAN acontece pelo Centreon, ao contrário da configuração normal do Nagios que utiliza arquivos de configuração em forma de texto (na realizadade, o que o Centreon faz é criar os arquivos de configuração para o Nagios, sem que o usuário tenha a necessidade de manipula-los manualmente).
Para adicionar um Host a ser monitorado é necessário responder a uma pergunta simples:
Você quer monitorar somente se o host está ativo na rede ou precisa de informações mais detalhadas sobre serviços ou estado de configurações?
Dependendo da resposta, a configuração do monitoramento terá algumas etapas extras.

Adicionando hosts – Caso 1 – Verificando disponibilidade

O caso mais simples de monitoramento que teremos é o de verificação de disponibilidade. A checagem acontece por um simples PING no alvo a ser monitorado. O Nagios envia um comando ping até o host e esse respondendo ao comando, tem seu estado definido como ativo. Esta forma de checagem tem suas vantagens e desvantagens, dependendo de que tipo de host será monitorado. Os casos de hosts que estão fora do local físico do datacenter, como o caso de redes independentes, hosts na internet ou que estão em segmentos distantes serão problemáticos para este tipo de verificação. A definição do tempo correto de retorno do PING evitará que sejam notificados falsos positivos.
A explicação é simples: o PING pode demorar muito tempo para ser respondido. Esta demora pode fazer com que o Nagios considere o host inativo, mesmo que este esteja ativo, mas demorando muito para responder.
É necessário atenção para estas situações e configurar os tempos de resposta de acordo com as situações dos hosts. Em caso de diversos erros notificados sem fundamentos, podemos definir o tempo máximo de resposta para valores elevados.
Abaixo segue o passo a passo para configurar o monitoramento de um host:
Selecione o menu Configuration e logo após o menu Hosts. Clique no botão Add, para adicionar um novo host, conforme indica a figura:


Será exibida a tela de adição de host do Centreon, com diversas opções a serem preenchidas.
Abaixo, segue a imagem da tela:

 

·Host Name

É o nome que vai identificar o host na configuração do Nagios.

·Alias

É o apelido ou a descrição do host.

·IP Address / DNS

Pode ser utilizado o endereço IP do host ou o nome FQDN (nome.dominio). Este é campo que será utilizado para a checagem.

·SNMP Comunnity & Version

Caso você esteja utilizando SNMP para o monitoramento do host, pode definir as configurações aqui. Não é o nosso caso.

·Monitored From

Em caso de uso de monitoramento distribuído, com vários servidores de monitoramento, defina aqui quem será o responsável por monitorar este Host.

·Host Templates

Este recurso no Centreon facilita a criação de hosts parecidos, trazendo configurações padronizadas por grupos de hosts. Um bom exemplo seria em uma rede que contenha diversos servidores Windows, eles poderiam ser adicionados a um template especifico, trazendo todos as variáveis de monitoramento e configurações predefinidas.

·Create Services linked to the Template too

Esta opção habilita os serviços a serem monitorados, configurados no template, para o host a ser adicionado.

·Check Period

Define o período que ocorrerá a checagem. Os períodos padronizados são: 24x7, none, nonworkhours, workhours. Estes períodos podem ser modificados, excluídos e adicionados nas configurações no Centreon.

·Check Command

Este é o comando que será utilizado para a checagem do host. Selecione na lista o valor check_centreon_ping.

·Args

Os argumentos que devem ser informados para que o comando de checagem funcione. Geralmente um exemplo dos valores é informado na caixa à direita. Para transportar os dados, apenas pressione a seta entre as duas caixas.

·Max Check Attempts

Número máximo de checagem que serão realizadas até que o Nagios defina o estado como problemático. Este número pode ser configurado com 3 tentativas.

·Normal Check Interval

Tempo entre uma checagem e outra. O valor colocado neste campo será multiplicado por 60 segundos. O tempo de checagem é fator muito importante quando o número de hosts e serviços cresce muito.

·Retry Check Interval

Tempo de rechecagem após uma detecção de um estado não ativo. Quando o host for definido como inativo, este tempo definirá quando o Nagios realizará uma nova verificação do estado. Deixe esta opção com 3.

·Active Checks Enabled

Habilita a checagem ativa para este host. A checagem ativa é controlada pelo Nagios, ou seja, o próprio Nagios realiza a verificação do estado do host, agendando as verificações periodicamente. Deixe esta opção em default.

·Passive Checks Enabled

Habilita a checagem passiva. A checagem passiva é realizada pelo host e transmitida para o Nagios para processamento. Deixe esta opção no default.

·Custom macros

Macros são variáveis criadas no Nagios para facilitar o monitoramento de servidores e serviços.

·Notification Enabled

Habilita ou não as notificações em caso de problemas.

·Linked Contacts

São listados os contatos disponíveis para as notificações. Para habilitar a notificação para um contato, selecione-o e clique no botão ADD. Quando ele estiver listado na caixa a direita, significa que o mesmo será notificado em caso de problema com este host.

·Linked Contact Groups

Podemos criar grupos de contatos para diversos tipos de serviços. Um exemplo seria sobre contatos responsáveis por servidores Windows ou Linux.

·Notification Interval

Intervalo de renotificação. Em caso de algum alerta ser gerado, o valor que for digitado neste campo (multiplicado por 60 segundos, ou 1 minuto) será o tempo que o Nagios esperará até que envie uma nova notificação. O valor zero desabilita a renotificação.

·Notification Period

Especifica os períodos que as notificações ocorrerão. Os valores desta caixa podem ser personalizados para se adequarem a rotina de trabalho da empresa ou dos responsáveis pelos equipamentos (veremos em outro capitulo).

·Notification Options

Aqui são definidos os diversos estados que o host pode ter para gerar uma notificação. Basta marcar os estados escolhidos:
  • DOWN
Quando o comando de checagem não obtém resposta do host, pela quantidade máxima de checagens estipulado em Max Check Attempts e os hosts acima deste na hierarquia de rede não estão sinalizando problemas.
  • Unreachable 
Quando os hosts acima deste estão acusando problemas. Pode ser o caso de um roteador sem funcionar, impedindo o Nagios de atingir o host monitorado.
  • Recovery
Quando o Host monitorado retorna o estado normal de operação.
  • Flapping 
Quando o host monitorado está variando o seu estado. É o caso, por exemplo, de alguma lentidão na rede ou no caminho até o host. A checagem pode obter sucesso em alguns momentos e falhas em outros. O Nagios identifica este procedimento como Flap State.
  • Downtime Scheduled
Alerta para desligamentos agendados. Em caso de manutenções preventivas ou agendadas, o Nagios pode enviar as notificações.

·First notification delay

Configura-se o tempo (em minutos – 60 segundos vezes o valor informado) para que o Nagios envie a primeira notificação. Deixando o valor zero, não teremos nenhum tempo para a notificação.
Após a definição dos valores para o host a ser monitorado, clique sobre o botão Save. Será apresentada a tela com o host configurado:


Note que o monitoramento ainda não está acontecendo. Estamos apenas definindo os valores para transportar para o Nagios.
Dentro de Configuration, selecione a guia Nagios:


Selecione os campos Move Export Files e Restart Nagios e clique no botão Export.


Observe que o valor Total Errors está em zero, isto significa que as configurações que foram definidas estão corretas e a geração dos arquivos de configuração do Nagios foi bem sucedida.
Volte a tela inicial do FAN e selecione o Nagios. Na tela do Nagios, selecione o campo Host Detail e observe que a máquina adicionada está listada junto com o localhost (o computador com o FAN nagios instalado):


Este processo pode ser repetido para todos os hosts que queremos monitorar.



Close Menu