[project @ peter@palfrader.org-20080403170456-wee80sulso1f1q04]
[mirror/dsa-nagios.git] / nagios-master.cfg
1 # Non comment lines are YAML
2 #
3 # Strings ought to be in double quotes, but it works in most cases if they aren't :)
4 #
5 # vim:set syntax=yaml:
6 ---
7 #############################
8 # hosts
9 #############################
10 servers:
11   gw-MAN-DA-debian:
12     address: 82.195.75.126
13     parents: gw-HP-ftc
14     hostgroups: routing-infrastructure
15   gw-HP-ftc:
16     address: 192.25.206.1
17     parents: samosa
18     hostgroups: routing-infrastructure
19   gw-brainfood:
20     address: 70.103.162.1
21     parents: gw-HP-ftc
22     hostgroups: routing-infrastructure
23   gw-brown.edu:
24     address: 128.148.34.1
25     parents: gw-HP-ftc
26     hostgroups: routing-infrastructure
27   gw-osuosl:
28     address: 140.211.166.1
29     parents: gw-HP-ftc
30     hostgroups: routing-infrastructure
31
32   samosa:
33     address: 192.25.206.57
34     hostgroups: computers, dl380, apache2-hosts, bind9-hosts
35
36   bartok:
37     address: 82.195.75.91
38     parents: gw-MAN-DA-debian
39     hostgroups: computers, syslog-ng-hosts, postfix-hosts, dl385
40   sperger:
41     address: 82.195.75.98
42     parents: gw-MAN-DA-debian
43     hostgroups: computers, porterbox, sw-raid
44
45   master:
46     address: 70.103.162.29
47     parents: gw-brainfood
48     hostgroups: computers, apache2-hosts, bind9-hosts
49
50   ries:
51     address: 128.148.34.103
52     parents: gw-brown.edu
53     hostgroups: computers, apache2-hosts, bind9-hosts, ftpd-hosts, dl385, rsyncd-hosts
54
55   rietz:
56     address: 140.211.166.43
57     parents: gw-brown.edu
58     hostgroups: computers, apache2-hosts, bind9-hosts, rsyncd-hosts, dl385
59   rietz2:
60     address: 140.211.166.44
61     parents: rietz
62     hostgroups: secondary-IPs
63
64 #############################
65 # host groups
66 #
67 # hostgroups ircd and all are automatically defined
68 #
69 #############################
70 hostgroups:
71   computers:
72     alias: computers
73     private: 1
74   routing-infrastructure:
75     alias: Internet routers and friends
76     extinfo-icon_image: base/switch40.png
77     extinfo-icon_image_alt: router
78
79   porterbox:
80     alias: developer accessible porter machien
81     extinfo-icon_image: base/debian.png
82     extinfo-icon_image_alt: Debian GNU/Linux
83     extinfo-notes_url: http://db.debian.org/machines.cgi?host=%s
84
85   dl380:
86     alias: HP DL380 hosts
87     private: 1
88   dl385:
89     alias: HP DL385 hosts
90     private: 1
91   sw-raid:
92     alias: Hosts with Linux software raid
93     private: 1
94
95   syslog-ng-hosts:
96     alias: hosts running syslog-ng instead of sysklogd
97     private: 1
98   postfix-hosts:
99     alias: hosts running postfix instead of exim
100     private: 1
101   apache2-hosts:
102     alias: hosts running apache2
103     private: 1
104   bind9-hosts:
105     alias: hosts running bind9
106     private: 1
107   ftpd-hosts:
108     alias: hosts running vsftpd
109     private: 1
110   rsyncd-hosts:
111     alias: hosts providing rsync services via xinetd
112     private: 1
113
114   secondary-IPs:
115     alias: secondary IP addresses
116     private: 1
117
118 #############################
119 # services
120 #############################
121 services:
122   -
123     name: PING
124     check: "check_ping!300.0,20%!600.0,40%"
125     hostgroups: all
126
127  ############ Services ############
128  ###
129
130  ############ Disk Usage ############
131  ####
132   -
133     name: disk usage - all
134     nrpe: "/usr/lib/nagios/plugins/check_disk 90 95"
135     hostgroups: computers
136   -
137     name: disk usage on /
138     nrpe: "/usr/lib/nagios/plugins/check_disk 60 80 /"
139     hostgroups: computers
140   -
141     name: disk usage on /boot
142     nrpe: "/usr/lib/nagios/plugins/check_disk 60 80 /boot"
143     hosts: sperger
144   -
145     name: disk usage on /var
146     nrpe: "/usr/lib/nagios/plugins/check_disk 50 75 /var"
147     hosts: bartok, samosa
148   -
149     name: disk usage on /org
150     nrpe: "/usr/lib/nagios/plugins/check_disk 80 90 /org"
151     hosts: bartok, sperger, samosa
152   -
153     name: disk usage on /tmp
154     nrpe: "/usr/lib/nagios/plugins/check_disk 60 80 /tmp"
155     hosts: samosa
156   -
157     name: disk usage on /usr
158     nrpe: "/usr/lib/nagios/plugins/check_disk 75 90 /usr"
159     hosts: samosa
160
161  ############ All Computers ############
162  ####
163   #-
164   #  name: apt - security updates
165   #  nrpe: "/usr/local/bin/nagios-check-apt-updates --warnifupdates"
166   #  hostgroups: computers
167   #  normal_check_interval: 480
168   #  notification_interval: 480
169   #  max_check_attempts: 4
170   #  retry_check_interval: 12
171  ####
172   -
173     name: users
174     nrpe: "/usr/lib/nagios/plugins/check_users 30 35"
175     hostgroups: computers
176  ####
177   -
178     name: load
179     nrpe: "/usr/lib/nagios/plugins/check_load -w 12,10,8 -c 22,18,14"
180     hostgroups: computers
181  ####
182   -
183     name: processes - zombies
184     nrpe: "/usr/lib/nagios/plugins/check_procs 5 10 -s Z"
185     hostgroups: computers
186  ####
187   -
188     name: processes - total
189     nrpe: "/usr/lib/nagios/plugins/check_procs 620 700"
190     hostgroups: computers
191  ####
192   -
193     name: swap usage - percent
194     nrpe: "/usr/lib/nagios/plugins/check_swap -w 20% -c 10%"
195     hostgroups: computers
196  ####
197   -
198     name: swap usage - mb
199     nrpe: "/usr/lib/nagios/plugins/check_swap -w 20000 -c 5000"
200     hostgroups: computers
201  ####
202   -
203     name: process - getty
204     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:8 -c 1: -u root -C getty -a /sbin/getty"
205     hostgroups: computers
206  ####
207   -
208     name: process - sshd
209     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:20 -c 1: -u root -C sshd -a '/usr/sbin/sshd'"
210     hostgroups: computers
211   -
212     name: "network service - sshd"
213     check: check_ssh
214     hostgroups: computers
215     depends: process - sshd
216     normal_check_interval:  60
217     notification_interval:  60
218  ####
219   -
220     name: network service - nrpe
221     check: check_tcp!5666
222     hostgroups: computers
223     max_check_attempts: -1
224   -
225     name: process - nrpe
226     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:25 -c 1: -u nagios -C nrpe -a '/usr/sbin/nrpe -c /etc/nagios/nrpe.cfg -d'"
227     hostgroups: computers
228     depends: network service - nrpe
229  ###
230   -
231     name: process - munin-node
232     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:2 -c 1: -u root -C munin-node -a '/usr/sbin/munin-node'"
233     hostgroups: computers
234   -
235     name: network service - munin-node
236     check: check_tcp!4949
237     hostgroups: computers
238     depends: process - munin-node
239  ###
240   -
241     name: process - ntpd
242     # sarge: nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C ntpd -a '/usr/sbin/ntpd -p /var/run/ntpd.pid'"
243     # etch: nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u ntp -C ntpd -a '/usr/sbin/ntpd -p /var/run/ntpd.pid'"
244     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -C ntpd -a '/usr/sbin/ntpd -p /var/run/ntpd.pid'"
245     hostgroups: computers
246   -
247     name: network service - ntp
248     check: check_ntp
249     hostgroups: computers
250     depends: process - ntpd
251  ###
252   -
253     name: process - atd
254     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u daemon -C atd -a /usr/sbin/atd"
255     hostgroups: computers
256  ###
257   -
258     name: process - cron
259     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C cron -a /usr/sbin/cron"
260     hostgroups: computers
261
262  ###
263   -
264     name: process - syslog-ng
265     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C syslog-ng  -a '/sbin/syslog-ng -p /var/run/syslog-ng.pid'"
266     hostgroups: syslog-ng-hosts
267  ###
268   -
269     name: process - syslogd
270     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C syslogd  -a '/sbin/syslogd'"
271     hostgroups: computers
272     excludehostgroups: syslog-ng-hosts
273   -
274     name: process - klogd
275     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C klogd  -a '/sbin/klogd -x'"
276     hostgroups: computers
277     excludehostgroups: syslog-ng-hosts
278
279  ### MAIL STUFF
280  ###
281   -
282     name: process - exim
283     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u Debian-exim -C exim4 -a '/usr/sbin/exim4 -bd -q'"
284     hostgroups: computers
285     excludehostgroups: postfix-hosts
286     excludehosts: master, rietz
287   -
288     name: process - exim
289     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:300 -c 1:500 -C exim4 -a '/usr/sbin/exim4'"
290     hosts: master, rietz
291  ###
292   -
293     name: process - clamav - clamd
294     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:2 -c 1: -u clamav -C clamd -a '/usr/sbin/clamd'"
295     hostgroups: computers
296     excludehostgroups: postfix-hosts
297   -
298     name: service - clamav
299     nrpe: "/usr/lib/nagios/plugins/check_clamd -H /var/run/clamav/clamd.ctl"
300     hostgroups: computers
301     excludehostgroups: postfix-hosts
302     depends: process - clamav - clamd
303   -
304     name: process - clamav - freshclam
305     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u clamav -C freshclam -a '/usr/bin/freshclam -d --quiet'"
306     hostgroups: computers
307     excludehostgroups: postfix-hosts
308  ###
309   -
310     name: process - spamd - master
311     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C spamd -a '/usr/sbin/spamd --create-prefs --max-children 5 --helper-home-dir -d --pidfile=/var/run/spamd.pid'"
312     #hosts: samosa
313     hostgroups: computers
314     excludehostgroups: postfix-hosts
315     excludehosts: rietz
316   -
317     name: process - spamd - child
318     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:6 -c 1: -C spamd -a 'spamd child'"
319     hostgroups: computers
320     excludehostgroups: postfix-hosts
321     depends: process - spamd - master
322     excludehosts: rietz
323   #
324   -
325     name: process - spamd - master
326     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u debbugs -C spamd -a '/usr/sbin/spamd -d '"
327     hosts: rietz
328   -
329     name: process - spamd - child
330     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:6 -c 1: -u debbugs -C spamd -a 'spamd child'"
331     hosts: rietz
332
333  ###
334   -
335     name: process - greylistd
336     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u greylist -C greylistd -a '/usr/bin/python /usr/sbin/greylistd'"
337     hostgroups: computers
338     excludehostgroups: postfix-hosts
339
340  ###
341   -
342     name: process - postfix - master
343     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C master -a '/usr/lib/postfix/master'"
344     hostgroups: postfix-hosts
345   -
346     name: process - postfix - qmgr
347     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u postfix -C qmgr -a 'qmgr -l -t fifo -u'"
348     hostgroups: postfix-hosts
349     depends: process - postfix - master
350   #-
351   #  name: process - postfix - tlsmgr
352   #  nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u postfix -C tlsmgr -a 'tlsmgr -l -t fifo -u'"
353   #  hostgroups: postfix-hosts
354   #  depends: process - postfix - master
355   -
356     name: process - postfix - pickup
357     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u postfix -C pickup -a 'pickup -l -t fifo -u -c'"
358     hostgroups: postfix-hosts
359     depends: process - postfix - master
360   -
361     name: process - postfix - anvil
362     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u postfix -C anvil -a 'anvil -l -t unix -u'"
363     hostgroups: postfix-hosts
364     depends: process - postfix - master
365
366   -
367     name: process - postfix - trivial-rewrite
368     nrpe: "/usr/lib/nagios/plugins/check_procs -w 0:10 -c 0:15 -u postfix -C trivial-rewrite -a 'trivial-rewrite -n rewrite -t unix -u -c'"
369     hostgroups: postfix-hosts
370     depends: process - postfix - master
371   -
372     name: process - postfix - proxymap
373     nrpe: "/usr/lib/nagios/plugins/check_procs -w 0:10 -c 0:15 -u postfix -C proxymap -a 'proxymap -t unix -u'"
374     hostgroups: postfix-hosts
375     depends: process - postfix - master
376   -
377     name: process - postfix - smtpd
378     nrpe: "/usr/lib/nagios/plugins/check_procs -w 0:10 -c 0:15 -u postfix -C smtpd -a 'smtpd -n smtp -t inet -u -c'"
379     hostgroups: postfix-hosts
380     depends: process - postfix - master
381   -
382     name: process - postfix - cleanup
383     nrpe: "/usr/lib/nagios/plugins/check_procs -w 0:30 -c 0:50 -u postfix -C cleanup -a 'cleanup -z -t unix -u -c'"
384     hostgroups: postfix-hosts
385     depends: process - postfix - master
386   -
387     name: process - postfix - local
388     nrpe: "/usr/lib/nagios/plugins/check_procs -w 0:30 -c 0:50 -u postfix -C local -a 'local -t unix'"
389     hostgroups: postfix-hosts
390     depends: process - postfix - master
391
392
393
394  ###
395   -
396     name: process - uptimed
397     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u daemon -C uptimed -a '/usr/sbin/uptimed'"
398     hostgroups: computers
399
400
401
402  ############ Processes/Services that only run on some computers ############
403  ####
404  ###
405   -
406     name: process - rngd
407     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C rngd  -a '/usr/sbin/rngd -r /dev/hwrng'"
408     hosts: bartok
409  ###
410   -
411     name: process - sensord
412     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C sensord  -a '/usr/sbin/sensord -f daemon'"
413     hosts: bartok
414
415  ###
416   -
417     name: process - mdadm monitor
418     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1:1 -u root -C mdadm -a '/sbin/mdadm --monitor --pid-file /var/run/mdadm/monitor.pid --daemonise --scan'"
419     hostgroups: sw-raid
420   -
421     name: RAID - sw raid
422     nrpe: "/usr/lib/nagios/plugins/dsa-check-raid-sw"
423     hostgroups: sw-raid
424
425  ###
426   -
427     name: process - cpqarrayd
428     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1:1 -u root -C cpqarrayd -a '/usr/sbin/cpqarrayd'"
429     hostgroups: dl385, dl380
430   -
431     name: RAID - arrayprobe
432     nrpe: "sudo /usr/bin/arrayprobe"
433     hostgroups: dl385, dl380
434
435  ###
436   -
437     name: process - slapd
438     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:20 -c 1:50 -u openldap -C slapd -a '/usr/sbin/slapd -g openldap -u openldap'"
439     hosts: samosa
440  ###
441   -
442     name: process - udevd
443     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C udevd -a 'udevd'"
444     hosts: sperger, ries
445  ###
446   -
447     name: process - acpid
448     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C acpid -a '/usr/sbin/acpid -c /etc/acpi/events -s /var/run/acpid.socket'"
449     hosts: ries
450
451  ###
452   -
453     name: process - xinetd
454     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C xinetd -a '/usr/sbin/xinetd -pidfile /var/run/xinetd.pid -stayalive'"
455     hosts: samosa
456     hostgroups: rsyncd-hosts
457  ###
458   -
459     name: network service - finger
460     check: check_tcp!79
461     hosts: samosa
462     depends: process - xinetd
463  ###
464   -
465     name: network service - rsync
466     check: check_tcp!873
467     hostgroups: rsyncd-hosts
468     depends: process - xinetd
469
470  ###
471   -
472     name: process - nagios1
473     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u nagios -C nagios -a '/usr/sbin/nagios -d /etc/nagios/nagios.cfg'"
474     hosts: samosa
475   -
476     name: process - nagios3
477     # it forks one instance to check, so make it -w 1:2
478     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:2 -c 1: -u nagios -C nagios3 -a '/usr/sbin/nagios3 -d /etc/nagios3/nagios.cfg'"
479     hosts: samosa
480
481  ###
482   -
483     name: process - apache2 - master
484     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1:1 -u root -C apache2 -a /usr/sbin/apache2"
485     hostgroups: apache2-hosts
486   -
487     name: process - apache2 - worker
488     nrpe: "/usr/lib/nagios/plugins/check_procs -w 2:50 -c 1:100 -u www-data -C apache2 -a /usr/sbin/apache2"
489     hostgroups: apache2-hosts
490     depends: process - apache2 - master
491   -
492     name: network service - http
493     check: check_http
494     hostgroups: apache2-hosts
495     depends: process - apache2 - master
496
497   -
498     name: network service - https
499     check: check_https
500     hosts: samosa
501     depends: "process - apache2 - master"
502     normal_check_interval: 120
503     notification_interval: 120
504   -
505     name: network service - https cert
506     check: dsa_check_cert!443
507     hosts: samosa
508     depends: network service - https
509     normal_check_interval: 240
510     notification_interval: 240
511  ####
512   -
513     name: process - named
514     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:15 -c 1: -u bind -C named -a '/usr/sbin/named -u bind'"
515     hostgroups: bind9-hosts
516   -
517     name: network service - dns
518     check: check_dns
519     hostgroups: bind9-hosts
520     depends: process - named
521
522  ####
523   -
524     name: process - vsftp - listener
525     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1:1 -u root -C vsftpd -a 'vsftpd: LISTENER'"
526     hostgroups: ftpd-hosts
527   -
528     name: process - vsftp - instance
529     nrpe: "/usr/lib/nagios/plugins/check_procs -w 0:10 -c 0:30 -u ftp -C vsftpd -a 'vsftpd: '"
530     hostgroups: ftpd-hosts
531   -
532     name: network service - ftp
533     check: check_ftp
534     hostgroups: ftpd-hosts
535     depends: process - vsftp - listener
536
537  ####
538   -
539     name: process - debianqueued
540     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1:1 -u dak -C debianqueued -a '/usr/bin/perl -w ./debianqueued'"
541     hosts: ries