Overview over Check_MKWas vor einigen Jahren mit einem kleinen Projekt begonnen hat, ist mittlerweile zu einer kompletten Monitoringlösung gewachsen. Das Projekt Check_MK besteht heute aus vielen Komponenten. Den Gesamtrahmen bildet OMD - die Open-Monitoring-Disribution - die die Aufgaben Installation, Management und Update übernimmt. Folgendes Diagramm gibt einen Überblick über alle Komponenten eines auf Check_MK basierenden Systems: ![]() Der Kern und die ChecksDen Kern des Systems bildet der Nagios Core, der weltweit bekannt ist und millionenfach eingesetzt wird. Die Aufgabe des Kerns ist das aktive Auslösen von Abfragen (Checks), das Verwalten der aktuellen Zustände von allen überwachten Systemen (Hosts) und Parametern (Services) und das Erkennen von Zustandsänderungen (z.B. wenn ein Service von OK auf CRIT wechselt). Das eigentliche Check_MK ist für das effiziente Durchführen von Statusabfragen zuständig. Das Abfragen geschieht zum einen mittels eines eigenen Agenten, den es für alle wichtigen Betriebssysteme gibt, sowie per SNMP, das üblicherweise für das Überwachen von Netzwerkgeräten, Appliances, Temperatursensoren und ähnlichen Geräten verwendet wird. Nur klassische Netzwerkchecks wie PING, DNS-Abfragen oder Checks per HTTP werden weiterhin von klassischen Nagios-Plugins ausgeführt. Die großen Vorteile von Check_MK gegenüber klassischen Checks sind:
Unsere Neuentwicklung Livecheck macht das Ausführen von aktiven Checks deutlich performanter und spart bei großen Installationen wertvolle Serverleistung. GUI-KomponentenDie von uns entwickelte Schnittstelle Livestatus erlaubt den effizienten Zugriff auf die Zustandsdaten im Kern und dient den Visualisierungskomponenten als Datenschnittstelle. Livestatus ersetzt dabei die sehr langsame Dateischnittstelle von Nagios ohne den Zusatzaufwand einer SQL-Datenbank - und das bei Antwortzeiten im Bereich von Microsekunden. Die Multisite Web Platform dient als Basis-Framework für die GUI-Komponenten Status-GUI, BI und WATO. Sie ist in Python implementiert und übernimmt den effizienten Zugriff auf die Livestatus-Schnittstelle, kümmert sich um Navigation, Berechtigungsverwaltung and andere grundlegende Dinge. Ihr modularer Aufbau ermöglicht die Entwicklung eigener kundenspezifischer Anwendungen, die sich nahtlos in das Monitoring-Framework eingliedern. Das wichtigste Multisite-Modul ist die Status GUI. Sie ersetzt das klassische Nagios-Webinterface und zeigt aktuelle Zustände von Hosts und Services in frei definierbaren Ansichten (Views) an. Eine herausragende Fähigkeit ist das parallele Anbinden an mehrere Nagios-Kerne. Auf diese Art kann ein verteiltes Monitoring aus vielen Instanzen von Nagios aufgebaut werden. Wie gut diese Methode skaliert, beweisen existierende produktive Installationen mit mehr als einer Million Services, die in einer zentralen Multisite-GUI dargestellt werden. Die Daten der einzelnen Monitoring-Server werden dabei völlig transparent zusammengeführt, so dass der Anwender ein in sich geschlossenes großes Monitoringsystem sieht. Das Business-Intelligence-Modul (kurz BI) extrahiert aus den Rohdaten des Monitorings den Zustand von kopmlexen Prozessen und Anwendungen. Dabei wird über eine baumartige Verknüpfung von Zuständen aus vielen Einzelwerten ein Gesamtstatus gebildet, wobei auch redundante Komponenten korrekt berücksichtigt werden. Das ermöglicht nicht nur einen schnellen Überblick, sondern hilft auch bei Fragestellungen wie .html"Welche Anwendungen sind vom Ausfall der Komponente X betroffen". Das Check_MK Web Administration Tool - kurz WATO - ist eine vollumfassende Konfigurationsoberfläche für Nagios und Check_MK. Über eine webbasierte GUI können Sie effizient Hosts und Services, Schwellwerte, Benutzer und Rollen, Tuningeinstellungen, verteiltes Monitoring und alle anderen wichtigen Dinge konfigurieren. WATO ist für sehr komplexe Umgebungen ausgelegt und kann auch Installation mit 50.000 Hosts effizient verwalten. Dabei unterstützt es auch das zentrale Verwalten eine Monitoring-Umgebung, die auf mehrere Server verteilt ist. NagVis ist die beliebteste Visualisierungslösung für Nagios. Auf frei definierbaren Kartendarstellungen oder Diagrammen stellt es aktuelle Statusdaten dar. NagVis gehört nicht zum Check_MK-Projekt sondern ist eigenständig. Der Hauptverwantwortliche Entwickler des Projektes Lars Michelsen ist seit 2010 unser fester Mitarbeiter. Für die Aufzeichnung von Messdaten über einen längeren Zeitraum (z.B. der Speicherverbrauch eines Rechners oder die Auslastung eines Switch-Ports) ist PNP4Nagios zuständig. Projektmaintainer Jörg Linge ist Mitglied im OMD-Team. Als Speicher-Backend kommt das hocheffiziente RRDTool zum Einsatz. AlarmierungBenachrichtigungen über Alarme werden mittels eines Zusatzmoduls gelöst, das in Zukunft eine Konfiguration für die Benutzer selbst über eine Web-GUI ermöglicht (z.B. ob nur Probleme gemeldet werden sollen oder auch die "Recoveries". |
| ||||||||||||