check_ganglia_metric

Software screenshot:
check_ganglia_metric
Podrobnosti Software:
Verze: 2012.02.28
Datum uploadu: 15 Apr 15
Licence: Volný
Popularita: 1

Rating: 3.0/5 (Total Votes: 1)

check_ganglia_metric je Nagios plugin, který vám umožní spouštět upozornění na jakékoliv ganglia metriky.
check_ganglia_metric byl silně inspirován Vladimíra Vuksan je check_ganglia_metric.php, ale přichází s řadou vylepšení.

Instalace

# Pip nainstalovat check_ganglia_metric
... Nebo:
# Easy_install check_ganglia_metric
Ganglia Configuration
Pokud váš server Nagios a ganglií Meta Daemon běží na stejném hostiteli, pravděpodobně budete muset upravit svůj gmetad.conf, aby z vašeho serveru Nagios vzdálené připojení.
Chcete-li povolit připojení z nagios-server.example.com:
trusted_hosts nagios-server.example.com
Chcete-li povolit připojení ze všech počítačů (pravděpodobně bezpečnostních rizik):
all_trusted na
Zkoušky na příkazovém řádku
Nejprve se podívejme, zda check_ganglia_metric může komunikovat s Ganglia Meta Daemon:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle
Status Ok, CPU Idle = 99,3% | cpu_idle = 99,3% ;;;;
"Ok Status" Zpráva ukazuje, že check_ganglia_metric pracuje. Máte-li potíže s to do práce, zkuste to znovu s podrobným protokolování povoleno (--verbose) za účelem získat lepší vhled do toho, co se děje špatně.
Nyní pojďme zkusit nastavit upozornění prahu:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle --critical = 99
Status kritický, CPU Idle = 99,6% | cpu_idle = 99,6% ;; 99 ;;
Řekli jsme check_ganglia_metric vrátit stav "kritické", pokud Idle CPU byla větší než 99. "Critical Status" Zpráva ukazuje, že to fungovalo. Všimněte si, že check_ganglia_metric analyzuje rozsah a limity v souladu s oficiálními doporučeními pro rozvoj plugin na Nagios.
Chcete-li vidět kompletní seznam možností příkazového řádku s krátkými vysvětlivkami, běží check_ganglia_metric s --help možnost.
Nagios Configuration
Za prvé, vytvořit definici příkazu:
definovat příkaz {
& Nbsp; název_příkazu check_ganglia_metric
& Nbsp; command_line /usr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ HOSTADDRESS $ --metric_name = $ ARG1 $ --warning = $ ARG2 $ --critical = $ ARG3 $
}
Nyní můžete použít výše uvedený příkaz ve svých definicích služeb:
definovat službu {
& Nbsp; service_description CPU nečinnosti - Ganglia
& Nbsp; použití some_template
! & Nbsp; check_command check_ganglia_metric cpu_idle 0: 20 0: 0!
& Nbsp; host_name host.example.com
}
To bude fungovat dobře, dokud se něco s check_ganglia_metric špatně (např soubor mezipaměti nelze číst / zapisovat, Ganglia Meta Daemon nelze dosáhnout, atd.). V tomto bodě, bude každá služba, která se opírá o check_ganglia_metric nepodaří, možná vás zaplavovat výstrahy. Můžeme tomu zabránit pomocí závislostí služeb.
První věc, kterou potřebujete, je definice příkaz pro kontrolu věku souboru:
definovat příkaz {
& Nbsp; název_příkazu check_file_age
& Nbsp; command_line / usr / lib / Nagios / plugins / check_file_age -f $ ARG1 $ -w $ ARG2 $ C $ ARG3 $
}
Dále jsme se definovat službu, která kontroluje věk souboru mezipaměti check_ganglia_metric je. Všimněte si, že aby byla skutečně účinná, je třeba tuto službu mají být kontrolovány nejméně as (možno více) častěji než všech ostatních kontrol, které se spoléhají na check_ganglia_metric:
definovat službu {
& Nbsp; service_description Cache pro check_ganglia_metric
& Nbsp; použití some_template
& Nbsp;!! Check_command check_file_age /var/lib/nagios/.check_ganglia_metric.cache 60 120
& Nbsp; host_name localhost
& Nbsp; check_interval 1
& nbsp; max_check_attempts 1
}
A nakonec jsme se nastavit aktuální servisní závislost. Všimněte si, že jsem umožnil use_regexp_matching v Nagios, který mi umožňuje použít regulární výrazy ve svých směrnicích. By lepení "- ganglií" na konci každé služby, který se opírá o check_ganglia_metric, mohu zachránit sebe spoustu úsilí:
definovat servicedependency {
& Nbsp; host_name localhost
& Nbsp; service_description Cache pro check_ganglia_metric
& Nbsp; dependent_host_name *.
& Nbsp;. Dependent_service_description * - Ganglia $
& Nbsp; execution_failure_criteria c, p
}
Nyní, když se něco s check_ganglia_metric špatného, ​​pouze jeden záznam bude odesláno o souboru cache, a všechny kontroly závislé služby budou pozastaveny, dokud vám vyřešit problém, který způsobil check_ganglia_metric k nezdaru. Jakmile je problém vyřešen, budete muset aktualizovat časové razítko na souboru cache, aby se dal "vyrovnávací paměť check_ganglia_metric" služba zpět do OK stavu (což umožní kontroly závislých služeb nadále):
& Nbsp; touch /var/lib/nagios/.check_ganglia_metric.cache
Tipy a triky
Je možné získat úplný seznam dostupných počítačů a metriky tím, že umožňuje "více podrobného" protokolování (-vv). Vzhledem k tomu, jsou vyžadovány metric_host a METRIC_NAME volby, budete mít trochu na "kuře a vejce" problém tady, ale to je v pořádku. Stačí dodat některé falešné údaje. Plugin bude chyba na konci s "hostitelským / metrický nebyl nalezen" chyba, ale ne dříve, než to vypíše jeho cache:
& Nbsp; check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = dummy dummy --metric_name = -vv

Co je nového v této verzi:

  • Přidat - -metrics_max_age možnost
  • Sloučit CHANGELOG.rst do README.rst

Požadavky na :

  • Python
  • Nagios

Omezení :

  • Nepracuje s Python 2.4

Podobný software

Nagisk
Nagisk

2 Jun 15

check_rbl
check_rbl

17 Feb 15

linux-metrics
linux-metrics

14 Apr 15

Snarl
Snarl

11 May 15

Komentáře k check_ganglia_metric

Komentáře nebyl nalezen
Přidat komentář
Zapnout obrázky!