Autre aspect du monitoring de serveur, c’est la consultation des logs générés par les services qui fonctionnent. Le problème, au fil du temps, les fichiers de logs sont nombreux et fastidieux à parcourir.
Cependant, il est important d’effectuer cette tâche afin de savoir si tout fonctionne correctement et d’anticiper des besoins de maintenance.
J’utilise depuis plusieurs semaines logwatch en complément de RPi-Monitor et Monit. Tous les matins, je reçois un mail qui résume la journée précédente. On peut choisir le niveau du résumé (petit, moyen ou détaillé), son format (texte ou hml) ainsi que des services à exclure. Par défaut il analyse tout le contenu du dossier /var/log
Pourquoi ce choix par rapport à Munin ou Cacti ? Ces deux outils effectuent des statistiques en continu et occupent beaucoup de temps CPU pour un ratio service/utilisation trop important par rapport à mes besoins.
Passons à l’installation :
sudo apt-get update
sudo apt-get install logwatch
Edition du fichier de configuration :
sudo vi /usr/share/logwatch/default.conf/logwatch.conf
Eléments intéressants dans ce fichier :
#Chemin des logs à analyser
LogDir = /var/log
#Sortie du compte-rendu
Output = mail
#Format de sortie du compte-rendu text ou HTML
Format = text
#Destinataire du CR
MailTo = userDestinataire
#Adresse de l’expéditeur
MailFrom = Logwatch
#Période du CR
Range = yesterday
#Niveau de détail du CR reçu par mail
Detail = Low
#Quels services à prendre en compte all = tous
Service = All
#En ignorant dovecot
Service = -dovecot
Pour tester si tout est ok (entre 30s et quelques minutes suivant les logs) :
logwatch
Il n’y a plus qu’à aller lire ses mails. Exemple pour un niveau medium :
################### Logwatch 7.4.0 (05/02/12) ####################
Processing Initiated: Tue Mar 25 06:25:50 2014
Date Range Processed: yesterday
( 2014-Mar-24 )
Period is day.
Detail Level of Output: 5
Type of Output/Format: mail / text
Logfiles for Host: XXX
##################################################################
——————— Amavisd-new Begin ————————
****** Summary *************************************************************************************
X Total messages scanned —————— 100.00%
XXXXXX K Total bytes scanned XXXXX
======== ==================================================
XX Passed ———————————- 100.00%
XX Clean passed 100.00%
======== ==================================================
XX Ham ————————————- 100.00%
XX Clean passed 100.00%
======== ==================================================
==================================================================================
Spam Score Percentiles 0% 50% 90% 95% 98% 100%
———————————————————————————-
Score Ham (XX) -0.799 -0.400 -0.081 -0.041 -0.017 -0.001
==================================================================================
======================================================================================================
Spam Score Frequency <= -10 <= -5 <= 0 <= 5 <= 10 <= 20 <= 30 > 30
——————————————————————————————————
Hits (XX) 0 0 2 0 0 0 0 0
Percent of Hits 0.00% 0.00% 100.00% 0.00% 0.00% 0.00% 0.00% 0.00%
======================================================================================================
———————- Amavisd-new End ————————-
——————— Cron Begin ————————
Commands Run:
User XXXX:
test -e /usr/sbin/amavisd-new-cronjob && /usr/sbin/amavisd-new-cronjob sa-clean: 1 Time(s)
test -e /usr/sbin/amavisd-new-cronjob && /usr/sbin/amavisd-new-cronjob sa-sync: 8 Time(s)
User XXXX:
cd / && run-parts –report /etc/cron.hourly: 24 Time(s)
[ -x /usr/lib/php5/maxlifetime ] && [ -d /var/lib/php5 ] && find /var/lib/php5/ -depth -mindepth 1 -maxdepth 1 -type f -ignore_readdir_race -cmin +$(/usr/lib/php5/maxlifetime) ! -execdir fuser -s {} 2>/dev/null \; -delete: 48 Time(s)
———————- Cron End ————————-
——————— fail2ban-messages Begin ————————
Banned services with Fail2Ban: Bans:Unbans
sasl: [ 1:0 ]
XXX.XXX.XXX.XXX (xxxxxxxxxxxxxx.com) 1:0
———————- fail2ban-messages End ————————-
——————— pam_unix Begin ————————
cron:
Sessions Opened:
XXX: 75 Time(s)
XXX: 9 Time(s)
dovecot:
Authentication Failures:
XXX: XX Time(s)
———————- pam_unix End ————————-
——————— Postfix Begin ————————
****** Summary *************************************************************************************
XX SASL authentication failed
XXXX K Bytes accepted XXXX
XXXX K Bytes sent via SMTP XXXX
XXXX K Bytes delivered XXXX
======== ==================================================
XX Accepted 100.00%
——– ————————————————–
XX Total 100.00%
======== ==================================================
XX Connections
XX Connections lost (inbound)
XX Disconnections
XX Removed from queue
XX Delivered
XX Sent via SMTP
XX Timeouts (inbound)
XX SMTP dialog errors
XX Hostname verification errors (FCRDNS)
****** Detail (XX) *********************************************************************************
———————- Postfix End ————————-
——————— Disk Space Begin ————————
Filesystem Size Used Avail Use% Mounted on
rootfs 219G 2.0G 206G 1% /
/dev/root 219G 2.0G 206G 1% /
devtmpfs 211M 0 211M 0% /dev
/dev/mmcblk0p1 56M 19M 38M 34% /boot
———————- Disk Space End ————————-
###################### Logwatch End #########################