[project @ peter@palfrader.org-20080402235336-1687nper3nw1vx7g]
[mirror/dsa-nagios.git] / nagios-master.cfg
1 # Non comment lines are YAML
2 #
3 # Strings ought to be in double quotes, but it works in most cases if they aren't :)
4 #
5 # vim:set syntax=yaml:
6 ---
7 #############################
8 # hosts
9 #############################
10 servers:
11   manda-debian-gw:
12     address: 82.195.75.126
13     hostgroups: routing-infrastructure
14
15   bartok:
16     address: 82.195.75.91
17     parents: manda-debian-gw
18     hostgroups: computers, syslog-ng-hosts, postfix-hosts, dl385
19   sperger:
20     address: 82.195.75.98
21     parents: manda-debian-gw
22     hostgroups: computers, sw-raid
23
24 #############################
25 # host groups
26 #
27 # hostgroups ircd and all are automatically defined
28 #
29 #############################
30 hostgroups:
31   computers:
32     alias: computers
33   routing-infrastructure:
34     alias: Internet routers and friends
35
36   syslog-ng-hosts:
37     alias: syslog-ng-hosts
38     private: 1
39   postfix-hosts:
40     alias: postfix-hosts
41     private: 1
42   dl385:
43     alias: HP DL385 hosts
44     private: 1
45   sw-raid:
46     alias: Hosts with Linux software raid
47     private: 1
48
49 #############################
50 # services
51 #############################
52 services:
53   -
54     name: PING
55     check: "check_ping!300.0,20%!600.0,40%"
56     hostgroups: all
57
58  ############ Services ############
59  ###
60
61  ############ Disk Usage ############
62  ####
63   -
64     name: disk usage - all
65     nrpe: "/usr/lib/nagios/plugins/check_disk 90 95"
66     hostgroups: computers
67   -
68     name: disk usage on /
69     nrpe: "/usr/lib/nagios/plugins/check_disk 60 80 /"
70     hostgroups: computers
71   -
72     name: disk usage on /boot
73     nrpe: "/usr/lib/nagios/plugins/check_disk 60 80 /boot"
74     hosts: sperger
75   -
76     name: disk usage on /var
77     nrpe: "/usr/lib/nagios/plugins/check_disk 50 75 /var"
78     hosts: bartok
79   -
80     name: disk usage on /org
81     nrpe: "/usr/lib/nagios/plugins/check_disk 80 90 /org"
82     hosts: bartok, sperger
83
84  ############ All Computers ############
85  ####
86   #-
87   #  name: apt - security updates
88   #  nrpe: "/usr/local/bin/nagios-check-apt-updates --warnifupdates"
89   #  hostgroups: computers
90   #  normal_check_interval: 480
91   #  notification_interval: 480
92   #  max_check_attempts: 4
93   #  retry_check_interval: 12
94  ####
95   -
96     name: users
97     nrpe: "/usr/lib/nagios/plugins/check_users 30 35"
98     hostgroups: computers
99  ####
100   -
101     name: load
102     nrpe: "/usr/lib/nagios/plugins/check_load -w 12,10,8 -c 22,18,14"
103     hostgroups: computers
104  ####
105   -
106     name: processes - zombies
107     nrpe: "/usr/lib/nagios/plugins/check_procs 5 10 -s Z"
108     hostgroups: computers
109  ####
110   -
111     name: processes - total
112     nrpe: "/usr/lib/nagios/plugins/check_procs 620 700"
113     hostgroups: computers
114  ####
115   -
116     name: swap usage - percent
117     nrpe: "/usr/lib/nagios/plugins/check_swap -w 20% -c 10%"
118     hostgroups: computers
119  ####
120   -
121     name: swap usage - mb
122     nrpe: "/usr/lib/nagios/plugins/check_swap -w 20000 -c 5000"
123     hostgroups: computers
124  ####
125   -
126     name: process - getty
127     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:8 -c 1: -u root -C getty -a /sbin/getty"
128     hostgroups: computers
129  ####
130   -
131     name: process - sshd
132     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:20 -c 1: -u root -C sshd -a '/usr/sbin/sshd'"
133     hostgroups: computers
134   -
135     name: "network service - sshd"
136     check: check_ssh
137     hostgroups: computers
138     depends: process - sshd
139     normal_check_interval:  60
140     notification_interval:  60
141  ####
142   -
143     name: network service - nrpe
144     check: check_tcp!5666
145     hostgroups: computers
146     max_check_attempts: -1
147   -
148     name: process - nrpe
149     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:25 -c 1: -u nagios -C nrpe -a '/usr/sbin/nrpe -c /etc/nagios/nrpe.cfg -d'"
150     hostgroups: computers
151     depends: network service - nrpe
152  ###
153   -
154     name: process - munin-node
155     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:2 -c 1: -u root -C munin-node -a '/usr/sbin/munin-node'"
156     hostgroups: computers
157   -
158     name: network service - munin-node
159     check: check_tcp!4949
160     hostgroups: computers
161     depends: process - munin-node
162  ###
163   -
164     name: process - ntpd
165     # sarge: nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C ntpd -a '/usr/sbin/ntpd -p /var/run/ntpd.pid'"
166     # etch: nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u ntp -C ntpd -a '/usr/sbin/ntpd -p /var/run/ntpd.pid'"
167     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -C ntpd -a '/usr/sbin/ntpd -p /var/run/ntpd.pid'"
168     hostgroups: computers
169   -
170     name: network service - ntp
171     check: check_ntp
172     hostgroups: computers
173     depends: process - ntpd
174  ###
175   -
176     name: process - atd
177     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u daemon -C atd -a /usr/sbin/atd"
178     hostgroups: computers
179  ###
180   -
181     name: process - cron
182     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C cron -a /usr/sbin/cron"
183     hostgroups: computers
184
185  ###
186   -
187     name: process - syslog-ng
188     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C syslog-ng  -a '/sbin/syslog-ng -p /var/run/syslog-ng.pid'"
189     hostgroups: syslog-ng-hosts
190  ###
191   -
192     name: process - syslogd
193     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C syslogd  -a '/sbin/syslogd'"
194     hostgroups: computers
195     excludehostgroups: syslog-ng-hosts
196   -
197     name: process - klogd
198     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C klogd  -a '/sbin/klogd -x'"
199     hostgroups: computers
200     excludehostgroups: syslog-ng-hosts
201
202  ###
203   -
204     name: process - exim
205     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u Debian-exim -C exim4 -a '/usr/sbin/exim4 -bd -q30m'"
206     hostgroups: computers
207     excludehostgroups: postfix-hosts
208  ###
209   -
210     name: process - clamav - clamd
211     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u clamav -C clamd -a '/usr/sbin/clamd'"
212     hostgroups: computers
213     excludehostgroups: postfix-hosts
214   -
215     name: service - clamav
216     nrpe: "/usr/lib/nagios/plugins/check_clamd -H /var/run/clamav/clamd.ctl"
217     hostgroups: computers
218     excludehostgroups: postfix-hosts
219     depends: process - clamav - clamd
220   -
221     name: process - clamav - freshclam
222     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u clamav -C freshclam -a '/usr/bin/freshclam -d --quiet'"
223     hostgroups: computers
224     excludehostgroups: postfix-hosts
225
226  ###
227   -
228     name: process - postfix - master
229     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C master -a '/usr/lib/postfix/master'"
230     hostgroups: postfix-hosts
231   -
232     name: process - postfix - qmgr
233     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u postfix -C qmgr -a 'qmgr -l -t fifo -u'"
234     hostgroups: postfix-hosts
235     depends: process - postfix - master
236   #-
237   #  name: process - postfix - tlsmgr
238   #  nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u postfix -C tlsmgr -a 'tlsmgr -l -t fifo -u'"
239   #  hostgroups: postfix-hosts
240   #  depends: process - postfix - master
241   -
242     name: process - postfix - pickup
243     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u postfix -C pickup -a 'pickup -l -t fifo -u -c'"
244     hostgroups: postfix-hosts
245     depends: process - postfix - master
246   -
247     name: process - postfix - anvil
248     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u postfix -C anvil -a 'anvil -l -t unix -u'"
249     hostgroups: postfix-hosts
250     depends: process - postfix - master
251
252   -
253     name: process - postfix - trivial-rewrite
254     nrpe: "/usr/lib/nagios/plugins/check_procs -w 0:10 -c 0:15 -u postfix -C trivial-rewrite -a 'trivial-rewrite -n rewrite -t unix -u -c'"
255     hostgroups: postfix-hosts
256     depends: process - postfix - master
257   -
258     name: process - postfix - proxymap
259     nrpe: "/usr/lib/nagios/plugins/check_procs -w 0:10 -c 0:15 -u postfix -C proxymap -a 'proxymap -t unix -u'"
260     hostgroups: postfix-hosts
261     depends: process - postfix - master
262   -
263     name: process - postfix - smtpd
264     nrpe: "/usr/lib/nagios/plugins/check_procs -w 0:10 -c 0:15 -u postfix -C smtpd -a 'smtpd -n smtp -t inet -u -c'"
265     hostgroups: postfix-hosts
266     depends: process - postfix - master
267   -
268     name: process - postfix - cleanup
269     nrpe: "/usr/lib/nagios/plugins/check_procs -w 0:30 -c 0:50 -u postfix -C cleanup -a 'cleanup -z -t unix -u -c'"
270     hostgroups: postfix-hosts
271     depends: process - postfix - master
272   -
273     name: process - postfix - local
274     nrpe: "/usr/lib/nagios/plugins/check_procs -w 0:30 -c 0:50 -u postfix -C local -a 'local -t unix'"
275     hostgroups: postfix-hosts
276     depends: process - postfix - master
277
278
279
280  ############ Processes/Services that only run on some computers ############
281  ####
282  ###
283   -
284     name: process - rngd
285     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C rngd  -a '/usr/sbin/rngd -r /dev/hwrng'"
286     hosts: bartok
287  ###
288   -
289     name: process - sensord
290     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1: -u root -C sensord  -a '/usr/sbin/sensord -f daemon'"
291     hosts: bartok
292
293  ###
294   -
295     name: process - mdadm monitor
296     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1:1 -u root -C mdadm -a '/sbin/mdadm --monitor --pid-file /var/run/mdadm/monitor.pid --daemonise --scan'"
297     hostgroups: sw-raid
298
299  ###
300   -
301     name: process - cpqarrayd
302     nrpe: "/usr/lib/nagios/plugins/check_procs -w 1:1 -c 1:1 -u root -C cpqarrayd -a '/usr/sbin/cpqarrayd'"
303     hostgroups: dl385
304  ###
305   -
306     name: process - raid - arrayprobe
307     nrpe: "sudo /usr/bin/arrayprobe"
308     hostgroups: dl385