Icinga/Nagios: DOWN vs UNREACHABLE

Frage eines Kunden zu den States im Icinga: Was hat es mit dem Status DOWN im Vergleich zu UNREACHABLE auf sich? Interessanterweise steht bei DOWN in den Details zum Host “Reachable: yes”. Intuitiv würde man “Reachable: no” erwarten.

Status

UP: Host ist pingbar (wobei Ping zwar die mit Abstand gebräuchlichste, aber nur eine von mehreren Möglichkeiten ist festzustellen, ob ein Host erreichbar ist).

DOWN: Host ist beispielsweise nicht pingbar.

UNREACHABLE: der Monitoring-Server weiss nicht, ob der Host UP oder DOWN ist, da er in einer Host-Hierarchie steckt, in der einer seiner Parents DOWN ist. Damit wird Icinga den Host nicht erreichen (und es auch gar nicht versuchen).

Reachable

Yes: es kann eine eindeutige Aussage über den Status des Hosts getroffen werden, also UP oder DOWN.

No: Host ist durch ein übergeordnetes DOWN in der Host-Hierarchie nicht erreichbar, daher wird auch der Status auf UNREACHABLE gesetzt. Eine Aussage über den Host ist nicht möglich - es kann sein, dass er läuft, oder auch nicht.

Notifications

Standardmässig versendet Icinga für alle Hosts im Status DOWN oder UNREACHABLE eine Notification. Normalerweise ist das aber zu viel des Guten - wenn Icinga berichtet, dass der Router/die Firewall down ist und man seine Netzwerk-Infrastruktur kennt, weiss man sowieso, dass alles dahinter unerreichbar ist. Daher wird man in der Praxis nach der Abbildung der Host-Hierarchien die Notifications für UNREACHABLE unterbinden.