HZW Monitoring
In der HZW Umgebung läuft auf den Linux VMs der Telegraf Service.
Dieser sammelt Informationen wie CPU Load, Plattennutzung etc. ein und schreibt sie in eine auf der vm_grafana gehostete InfluxDB.
Diese InfluxDB wird als Datenquelle an Grafana angeschlossen, einer Datenvisualisierungsplattform.
Unser Grafana ist unter https://grafana.hackzenwerk.org gehostet.
Contents
Schematische Darstellung der Funktionsweise
Informationen Grafana einsehen
In Grafana werden Informationen in Boards abgebildet, welche mehrere Dinge in einer übersicht zusammenfassen.
Wählt nach dem Login auf der linken Seite Dashboards > Manage aus um eine Liste der verfügbaren Boards anzuzeigen.
In dem Board Telegraf - system metrics sind die Metriken der virtuellen Maschinen zu finden.
In diesem Board könnt Ihr in der Kopfzeile den Server auswählen, zu dem Ihr Statistiken einsehen wollt.
Wählt oben Rechts einen Zeitrahmen aus, zu dem Ihr informationen haben wollt.
InluxDB und Telegraf
Die Konfiguration von Telegraf, also die Einstellungen was wie eingesammelt werden soll, geschieht unter /etc/telegraf/telegraf.conf
Ich werde hier in dem Artikel nicht alle Settings dieser Konfig durchgehen, dafür ist die offizielle Dokumentation da.
Allerdings kann ich ein paar exemplarische Beispiele geben.
Die im oberen Screenshot zu sehenden CPU Statistiken liegen folgender Config zugrunde.
[[inputs.cpu]] percpu = true totalcpu = true collect_cpu_time = false report_active = false
Das die Daten in der InfluxDB laden wird durch folgende config erreicht.
[[outputs.influxdb]
In folgendem Format werden die Informationen in der Datenbank abgelegt: [Messung] [Key=Value] [Timestamp]
Ihr könnt euch mit telegraf --test auf einer der VMs eine liste der eingesammelten Werte anzeigen lassen.