= Prometheus AlertManager = == Ziel == Ablösen von Icinga durch Prometheus. In dem Artikel geht es darum was der Alertmanager an Funktionalitäten benötigt um Icinga abzulösen. Informationen zu Prometheus befinden sich [[./Prometheus|hier]]. == Alerts == In der Tabelle werden Alerts aus dem Altsystem zusammen gefasst und betrachtet wie diese in den Alertmanager übernommen werden können. Aus 20_base2.cfg || Titel || Command || Umsetzung || Infos || || (1) check_crond || /usr/lib64/nagios/plugins/check_procs -v -w 1: -c 1: -C crond || script_exporter.pl/check_systemd_process() || || || (2) check_rsyslogd || /usr/lib64/nagios/plugins/check_procs -v -w 1: -c 1: -C rsyslogd || script_exporter.pl/check_process() || || || (3) check_zombie_procs || /usr/lib64/nagios/plugins/check_procs -w 5 -c 10 -s ZN || script_exporter.pl/check_zombie_process() || [[https://www.unix.com/unix-for-dummies-questions-and-answers/100737-how-do-you-create-zombie-process.html|Script]] zum erzeugen eines Zombieprozesses || || (4) check_swap || /usr/lib64/nagios/plugins/check_swap -w 50% -c 20% || node_vmstat_kswapd_* node_vmstat_pgscan_kswapd_* node_memory_Swap* || || || (5) check_load || /usr/lib64/nagios/plugins/check_load -w 15,10,5 -c 30,25,20 || node_load* || || || (6) check_total_procs || usr/lib64/nagios/plugins/check_procs -k -w 700 -c 800 || || || || (7) check_disks || /usr/lib/nagios/plugins/check_disks -w 10% -c 5% || || || || (8) check_mem || /usr/lib/nagios/plugins/check_mem -w 80% -c 95% || || || || (9) check_memcache || /usr/lib/nagios/plugins/check_memcache -w 30 -c 25 || || || || (10) check_ramspeed || /usr/nagios/libexec/check_ramspeed -w 5 -c 2 || script_exporter.pl/memory_speed() || || || (11) check_crl || /usr/lib/nagios/plugins/check_crl -w 2 -c 4 || || || || (12)check_cvmfs || /usr/lib/nagios/plugins/check_cvmfs || || || || (13) check_mounts || /usr/lib/nagios/plugins/check_mounts || || || || (14) check_ipmisel || usr/lib/nagios/plugins/check_ipmisel || || || || (15) check_bonding || /usr/lib/nagios/plugins/check_bonding || || || == Offene Frage == zu check_ramspeed (10) * wo ist im Altsystem definiert welcher Rechner welche Geschwindigkeit bereitstellen muss bevor ein Alert ausgelöst wird * wie oft wird es aufgerufen * warum ist [vulcan01] /etc/prometheus/ssl/client.crl leer == Todo Liste == Offen * Änderungen für Wünsche am GIT Projekt (inventar als ini und ein Playbook ohne includes) mit Timm besprechen Umgesetzt * Projekt nach GIT umziehen https://stash.desy.de/projects/ZNDV/repos/ansible-prometheus/browse * Testrechner aufgesetzt der die neuen exportiert (flaco-vm10) == Probleme == * Auslagern der Konfiguration unter /etc/prometheus/config funktioniert nicht. Finde zu der Option auch nichts in der Doku vom [[https://github.com/QubitProducts/exporter_exporter|exporter_exporter]]. == Weiterführende Links == * [[https://github.com/QubitProducts/exporter_exporter|exporter_exporter]]