3035
Comment:
|
3072
|
Deletions are marked like this. | Additions are marked like this. |
Line 15: | Line 15: |
Line 17: | Line 16: |
|| (6) check_total_procs || usr/lib64/nagios/plugins/check_procs -k -w 700 -c 800 || || || | || (6) check_total_procs || usr/lib64/nagios/plugins/check_procs -k -w 700 -c 800 || script_exporter.pl/check_sum_process() || || |
Prometheus AlertManager
Ziel
Ablösen von Icinga durch Prometheus. In dem Artikel geht es darum was der Alertmanager an Funktionalitäten benötigt um Icinga abzulösen. Informationen zu Prometheus befinden sich hier.
Alerts
In der Tabelle werden Alerts aus dem Altsystem zusammen gefasst und betrachtet wie diese in den Alertmanager übernommen werden können. Aus 20_base2.cfg
Titel |
Command |
Umsetzung |
Infos |
(1) check_crond |
/usr/lib64/nagios/plugins/check_procs -v -w 1: -c 1: -C crond |
script_exporter.pl/check_systemd_process() |
|
(2) check_rsyslogd |
/usr/lib64/nagios/plugins/check_procs -v -w 1: -c 1: -C rsyslogd |
script_exporter.pl/check_process() |
|
(3) check_zombie_procs |
/usr/lib64/nagios/plugins/check_procs -w 5 -c 10 -s ZN |
script_exporter.pl/check_zombie_process() |
Script zum erzeugen eines Zombieprozesses |
(4) check_swap |
/usr/lib64/nagios/plugins/check_swap -w 50% -c 20% |
node_vmstat_kswapd_* node_vmstat_pgscan_kswapd_* node_memory_Swap* |
|
(5) check_load |
/usr/lib64/nagios/plugins/check_load -w 15,10,5 -c 30,25,20 |
node_load* |
|
(6) check_total_procs |
usr/lib64/nagios/plugins/check_procs -k -w 700 -c 800 |
script_exporter.pl/check_sum_process() |
|
(7) check_disks |
/usr/lib/nagios/plugins/check_disks -w 10% -c 5% |
|
|
(8) check_mem |
/usr/lib/nagios/plugins/check_mem -w 80% -c 95% |
|
|
(9) check_memcache |
/usr/lib/nagios/plugins/check_memcache -w 30 -c 25 |
|
|
(10) check_ramspeed |
/usr/nagios/libexec/check_ramspeed -w 5 -c 2 |
script_exporter.pl/memory_speed() |
|
(11) check_crl |
/usr/lib/nagios/plugins/check_crl -w 2 -c 4 |
|
|
(12)check_cvmfs |
/usr/lib/nagios/plugins/check_cvmfs |
|
|
(13) check_mounts |
/usr/lib/nagios/plugins/check_mounts |
|
|
(14) check_ipmisel |
usr/lib/nagios/plugins/check_ipmisel |
|
|
(15) check_bonding |
/usr/lib/nagios/plugins/check_bonding |
|
|
Offene Frage
zu check_ramspeed (10)
- wo ist im Altsystem definiert welcher Rechner welche Geschwindigkeit bereitstellen muss bevor ein Alert ausgelöst wird
- wie oft wird es aufgerufen
- warum ist [vulcan01] /etc/prometheus/ssl/client.crl leer
Todo Liste
Offen
- Änderungen für Wünsche am GIT Projekt (inventar als ini und ein Playbook ohne includes) mit Timm besprechen
Umgesetzt
Projekt nach GIT umziehen https://stash.desy.de/projects/ZNDV/repos/ansible-prometheus/browse
- Testrechner aufgesetzt der die neuen exportiert (flaco-vm10)
Probleme
Auslagern der Konfiguration unter /etc/prometheus/config funktioniert nicht. Finde zu der Option auch nichts in der Doku vom exporter_exporter.