====== Solution de monitoring ======
===== Introduction =====
Le monitoring de la plateforme sera réalisé à l'aide de 2 logiciels:
* munin
* nagios
Dans cette documentation, la machine hébergeant les différents services de monitoring est définie comme suit:
* fqdn: loghost.domain.tld
* adresse IP: 10.10.1.30
les différentes machines clientes sont quand à elles définies ainsi:
* fqdn: vm_x.domain.tld
* IP adresse: appartient au réseau 10.10.1.0/24
===== Installation du serveur munin =====
Munin permet de monitorer précisément le fonctionnement d'un certains nombres de services fournis par les différentes machine du réseau. Dans notre contexte, le serveur central munin sera installé sur la machine loghost.
* Installation du paquet munin
apt-get install munin
Cette commande permet d'installer le serveur munin ainsi que le client qui réalise
le monitoring des différents services locaux: munin-node.
On commence par configurer le serveur
* Configuration du serveur munin
nano /etc/munin/munin.conf
dbdir /var/lib/munin
htmldir /var/www/localhost/munin
logdir /var/log/munin
rundir /var/run/munin
tmpldir /etc/munin/templates
[loghost.domain.tld]
address 10.10.1.30
use_node_name yes
[vm_1.domain.tld]
address 10.10.1.40
use_node_name yes
...etc...
Puis on passe à la configuration du node local:
nano /etc/munin/munin-node.conf
log_level 4
log_file /var/log/munin/munin-node.log
pid_file /var/run/munin/munin-node.pid
background 1
setseid 1
user root
group root
setsid yes
# Regexps for files to ignore
ignore_file ~$
ignore_file \.bak$
ignore_file %$
ignore_file \.dpkg-(tmp|new|old|dist)$
ignore_file \.rpm(save|new)$
ignore_file \.pod$
host_name loghost.domain.tld
allow ^127\.0\.0\.1$
cidr_allow 10.10.1.0/24
host 10.10.1.30
port 4949
Les deux dernières lignes de ce fichier de conf indiquent que munin-node attends les requètes du serveur sur l'interface 10.10.1.31 au port 4949. Il faudra donc s'assurer qu'aucun firewall ne bloque l'accès à ce port.
Pour prendre en compte notre nouvelle config, on relance le node local:
/etc/init.d/munin-node restart
Le serveur utilise une tâche cron pour requêter sur les différentes machines qu'il doit monitorer.
===== Installation des clients munin-node =====
Au niveau des machines clientes, seul munin-node est nécessaire donc:
* Installation du paquet munin-node
apt-get install munin-node
Pour les clients il suffit de renseigner le fichier de config munin-node.conf:
* Configuration du node sur les clients:
nano /etc/munin/munin-node.conf
log_level 4
log_file /var/log/munin/munin-node.log
pid_file /var/run/munin/munin-node.pid
background 1
setseid 1
user root
group root
setsid yes
ignore_file ~$
ignore_file \.bak$
ignore_file %$
ignore_file \.dpkg-(tmp|new|old|dist)$
ignore_file \.rpm(save|new)$
ignore_file \.pod$
host_name vm_1.domain.tld
allow ^10\.10\.1\.30$
host 10.10.1.40
port 4949
ATTENTION aux 3 dernières lignes:
* allow ^10\.10\.1\.30$ : on autorise le serveur à questionner le node local
* host 10.10.1.40 : le node local écoute sur l'interface d'adresse 10.10.1.40
* le node local écoute sur le port 4949
Voila, il ne reste plus qu'a relancer le node local sur la machine cliente:
/etc/init.d/munin-node restart
===== Installation du serveur nagios =====
Nagios est un logiciel spécialisé dans le monitoring du réseau, sa configuration pouvant être laborieuse (tous ce fait en éditant des fichiers de conf à la main), nous avons choisi de le coupler avec centreon qui offre les possibilités suivantes:
* amélioration de l'interface de gestion de nagios
* configuration de nagios grâce à des formulaires
* création de graphiques
* ...
* Installation du paquet nagios
apt-get install nagios3