====== Solution de monitoring ====== ===== Introduction ===== Le monitoring de la plateforme sera réalisé à l'aide de 2 logiciels: * munin * nagios Dans cette documentation, la machine hébergeant les différents services de monitoring est définie comme suit: * fqdn: loghost.domain.tld * adresse IP: 10.10.1.30 les différentes machines clientes sont quand à elles définies ainsi: * fqdn: vm_x.domain.tld * IP adresse: appartient au réseau 10.10.1.0/24 ===== Installation du serveur munin ===== Munin permet de monitorer précisément le fonctionnement d'un certains nombres de services fournis par les différentes machine du réseau. Dans notre contexte, le serveur central munin sera installé sur la machine loghost. * Installation du paquet munin apt-get install munin Cette commande permet d'installer le serveur munin ainsi que le client qui réalise le monitoring des différents services locaux: munin-node. On commence par configurer le serveur * Configuration du serveur munin nano /etc/munin/munin.conf dbdir /var/lib/munin htmldir /var/www/localhost/munin logdir /var/log/munin rundir /var/run/munin tmpldir /etc/munin/templates [loghost.domain.tld] address 10.10.1.30 use_node_name yes [vm_1.domain.tld] address 10.10.1.40 use_node_name yes ...etc... Puis on passe à la configuration du node local: nano /etc/munin/munin-node.conf log_level 4 log_file /var/log/munin/munin-node.log pid_file /var/run/munin/munin-node.pid background 1 setseid 1 user root group root setsid yes # Regexps for files to ignore ignore_file ~$ ignore_file \.bak$ ignore_file %$ ignore_file \.dpkg-(tmp|new|old|dist)$ ignore_file \.rpm(save|new)$ ignore_file \.pod$ host_name loghost.domain.tld allow ^127\.0\.0\.1$ cidr_allow 10.10.1.0/24 host 10.10.1.30 port 4949 Les deux dernières lignes de ce fichier de conf indiquent que munin-node attends les requètes du serveur sur l'interface 10.10.1.31 au port 4949. Il faudra donc s'assurer qu'aucun firewall ne bloque l'accès à ce port. Pour prendre en compte notre nouvelle config, on relance le node local: /etc/init.d/munin-node restart Le serveur utilise une tâche cron pour requêter sur les différentes machines qu'il doit monitorer. ===== Installation des clients munin-node ===== Au niveau des machines clientes, seul munin-node est nécessaire donc: * Installation du paquet munin-node apt-get install munin-node Pour les clients il suffit de renseigner le fichier de config munin-node.conf: * Configuration du node sur les clients: nano /etc/munin/munin-node.conf log_level 4 log_file /var/log/munin/munin-node.log pid_file /var/run/munin/munin-node.pid background 1 setseid 1 user root group root setsid yes ignore_file ~$ ignore_file \.bak$ ignore_file %$ ignore_file \.dpkg-(tmp|new|old|dist)$ ignore_file \.rpm(save|new)$ ignore_file \.pod$ host_name vm_1.domain.tld allow ^10\.10\.1\.30$ host 10.10.1.40 port 4949 ATTENTION aux 3 dernières lignes: * allow ^10\.10\.1\.30$ : on autorise le serveur à questionner le node local * host 10.10.1.40 : le node local écoute sur l'interface d'adresse 10.10.1.40 * le node local écoute sur le port 4949 Voila, il ne reste plus qu'a relancer le node local sur la machine cliente: /etc/init.d/munin-node restart ===== Installation du serveur nagios ===== Nagios est un logiciel spécialisé dans le monitoring du réseau, sa configuration pouvant être laborieuse (tous ce fait en éditant des fichiers de conf à la main), nous avons choisi de le coupler avec centreon qui offre les possibilités suivantes: * amélioration de l'interface de gestion de nagios * configuration de nagios grâce à des formulaires * création de graphiques * ... * Installation du paquet nagios apt-get install nagios3