Le monitoring de la plateforme sera réalisé à l'aide de 2 logiciels:
Dans cette documentation, la machine hébergeant les différents services de monitoring est définie comme suit:
les différentes machines clientes sont quand à elles définies ainsi:
Munin permet de monitorer précisément le fonctionnement d'un certains nombres de services fournis par les différentes machine du réseau. Dans notre contexte, le serveur central munin sera installé sur la machine loghost.
apt-get install munin
Cette commande permet d'installer le serveur munin ainsi que le client qui réalise le monitoring des différents services locaux: munin-node. On commence par configurer le serveur
nano /etc/munin/munin.conf dbdir /var/lib/munin htmldir /var/www/localhost/munin logdir /var/log/munin rundir /var/run/munin tmpldir /etc/munin/templates [loghost.domain.tld] address 10.10.1.30 use_node_name yes [vm_1.domain.tld] address 10.10.1.40 use_node_name yes ...etc...
Puis on passe à la configuration du node local:
nano /etc/munin/munin-node.conf log_level 4 log_file /var/log/munin/munin-node.log pid_file /var/run/munin/munin-node.pid background 1 setseid 1 user root group root setsid yes # Regexps for files to ignore ignore_file ~$ ignore_file \.bak$ ignore_file %$ ignore_file \.dpkg-(tmp|new|old|dist)$ ignore_file \.rpm(save|new)$ ignore_file \.pod$ host_name loghost.domain.tld allow ^127\.0\.0\.1$ cidr_allow 10.10.1.0/24 host 10.10.1.30 port 4949
Les deux dernières lignes de ce fichier de conf indiquent que munin-node attends les requètes du serveur sur l'interface 10.10.1.31 au port 4949. Il faudra donc s'assurer qu'aucun firewall ne bloque l'accès à ce port.
Pour prendre en compte notre nouvelle config, on relance le node local:
/etc/init.d/munin-node restart
Le serveur utilise une tâche cron pour requêter sur les différentes machines qu'il doit monitorer.
Au niveau des machines clientes, seul munin-node est nécessaire donc:
apt-get install munin-node
Pour les clients il suffit de renseigner le fichier de config munin-node.conf:
nano /etc/munin/munin-node.conf log_level 4 log_file /var/log/munin/munin-node.log pid_file /var/run/munin/munin-node.pid background 1 setseid 1 user root group root setsid yes ignore_file ~$ ignore_file \.bak$ ignore_file %$ ignore_file \.dpkg-(tmp|new|old|dist)$ ignore_file \.rpm(save|new)$ ignore_file \.pod$ host_name vm_1.domain.tld allow ^10\.10\.1\.30$ host 10.10.1.40 port 4949
ATTENTION aux 3 dernières lignes:
Voila, il ne reste plus qu'a relancer le node local sur la machine cliente:
/etc/init.d/munin-node restart
Nagios est un logiciel spécialisé dans le monitoring du réseau, sa configuration pouvant être laborieuse (tous ce fait en éditant des fichiers de conf à la main), nous avons choisi de le coupler avec centreon qui offre les possibilités suivantes:
apt-get install nagios3