Quantcast
Channel: Monitoring-Portal Feed
Viewing all 1338 articles
Browse latest View live

icinga2 check_jmx return errors

$
0
0
Hi,

I'm adding check_jmx plugin in icinga2, but I'm not sure if my configurations are correct because I'm getting an error


root@cfe7a2eab147:/usr/lib/nagios/plugins# ./check_jmx -U service:jmx:rmi:///jndi/rmi://localhost:9999/jmxrmi -O java.lang:type=Memory -A HeapMemoryUsage -K used -I HeapMemoryUsage -J used -vvvv -w 731847066 -c 1045495808 -username "username -password "passwd
JMX CRITICAL Connection refused to host: localhost; nested exception is:
java.net.ConnectException: Connection refused connecting to java.lang:type=Memory by URL service:jmx:rmi:///jndi/rmi://lee:9999/jmxrmijava.rmi.ConnectException: Connection refused to host: localhost; nested exception is:
java.net.ConnectException: Connection refused
at sun.rmi.transport.tcp.TCPEndpoint.newSocket(TCPEndpoint.java:619)
at sun.rmi.transport.tcp.TCPChannel.createConnection(TCPChannel.java:216)
at sun.rmi.transport.tcp.TCPChannel.newConnection(TCPChannel.java:202)
at sun.rmi.server.UnicastRef.invoke(UnicastRef.java:129)
at javax.management.remote.rmi.RMIServerImpl_Stub.newClient(Unknown Source)
at javax.management.remote.rmi.RMIConnector.getConnection(RMIConnector.java:2404)
at javax.management.remote.rmi.RMIConnector.connect(RMIConnector.java:308)
at javax.management.remote.JMXConnectorFactory.connect(JMXConnectorFactory.java:268)
at javax.management.remote.JMXConnectorFactory.connect(JMXConnectorFactory.java:227)
at org.nagios.JMXQuery.connect(JMXQuery.java:53)
at org.nagios.JMXQuery.main(JMXQuery.java:75)
Caused by: java.net.ConnectException: Connection refused
at java.net.PlainSocketImpl.socketConnect(Native Method)
at java.net.AbstractPlainSocketImpl.doConnect(AbstractPlainSocketImpl.java:339)
at java.net.AbstractPlainSocketImpl.connectToAddress(AbstractPlainSocketImpl.java:200)
at java.net.AbstractPlainSocketImpl.connect(AbstractPlainSocketImpl.java:182)
at java.net.SocksSocketImpl.connect(SocksSocketImpl.java:392)
at java.net.Socket.connect(Socket.java:579)
at java.net.Socket.connect(Socket.java:528)
at java.net.Socket.<init>(Socket.java:425)
at java.net.Socket.<init>(Socket.java:208)
at sun.rmi.transport.proxy.RMIDirectSocketFactory.createSocket(RMIDirectSocketFactory.java:40)
at sun.rmi.transport.proxy.RMIMasterSocketFactory.createSocket(RMIMasterSocketFactory.java:147)
at sun.rmi.transport.tcp.TCPEndpoint.newSocket(TCPEndpoint.java:613)
... 10 more

Here's my configurations for check_jmx

commands.conf


object CheckCommand "check_jmx" {
import "plugin-check-command"
command = [ PluginDir + "/check_jmx" ]
arguments = {
"-U" = "$service_url$"
"-O" = "$object_name$"
"-A" = "$attrib_name$"
"-K" = "$comp_key$"
"-w" = "$warn$"
"-c" = "$crit$"
"--username" = "username"
"--password" = "passwd"
}
}

service_jmx.conf


#apply service for jmx

apply Service "jmx" to Host {
import "generic-service"
check_command = "check_jmx"
vars.service_url = "service:jmx:rmi:///jndi/rmi://" + host.name + ":9999/jmxrmi"
vars.object_name = "java.lang:type=Memory"
vars.attrib_name = "HeapMemoryUsage"
vars.comp_key = "used"
vars.warn = "731847066"
vars.crit = "1045495808"

assign where host.vars.os == "Linux"
}

can someone help me to fix this error.

thanks!

How can I verify the "state" of a Host or Service?

$
0
0
I want to be able to determine what state a specific service is in. Whether it has notifications enabled, or active/passive checks enabled, etc. I can run `icinga2 object list` to get the configuration, however that's not enough because what if I've checked or unchecked those options in the web2 interface? How can I verify that those checkboxes are working?

This is all because I have a service that I can't seem to disable notifications and checks for - unless I remove it from the configuration files, which is not how I want to handle this situation. Maybe I should be posting this in the web2 forum, but here, I'd like to know how to verify that the backend icinga2 is correctly reading the settings in icingaweb2.

(I'm on the latest versions of icinga2 and icingaweb2.)

icinga web 2 with iciniga 1 skin?

$
0
0
We have quite a large investment with Icinga 1 ( currently on 1.08 ) and have just kicked off a project to upgrade to Icinga 2.4.

The procedures and training for our NOC and OPS centers are heavily built around the old Icinga 1 web interface. personally, I really like the Icinga Web 2 interface, but one of the requirements of the upgrade is that presentation doesn't change.

Is there a skin, or a template, or a theme that is more like Icinga Web 1? Or some other solution?

Verify des client certificates funktioniert nicht.

$
0
0
Moin!

Quellcode

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
[root@icinga2b pki]# pwd
/etc/icinga2/pki
[root@icinga2b pki]# ls -la
total 12
drwx------ 2 icinga icinga 4096 Jan 15 20:58 .
drwxr-x--- 9 icinga icinga 4096 Jan 15 18:21 ..
-rw-r--r-- 1 icinga icinga 1696 Jan 15 20:57 ca.crt
[root@icinga2b pki]# icinga2 pki new-cert --cn icinga2b --key icinga2b.key --csr icinga2b.csr
information/base: Writing private key to 'icinga2b.key'.
information/base: Writing certificate signing request to 'icinga2b.csr'.
[root@icinga2b pki]# icinga2 pki sign-csr --csr icinga2b.csr --cert icinga2b.crt
[root@icinga2b pki]# ls -la
total 24
drwx------ 2 icinga icinga 4096 Jan 15 20:58 .
drwxr-x--- 9 icinga icinga 4096 Jan 15 18:21 ..
-rw-r--r-- 1 icinga icinga 1696 Jan 15 20:57 ca.crt
-rw-r--r-- 1 icinga icinga 1688 Jan 15 20:58 icinga2b.crt
-rw-r--r-- 1 icinga icinga 1582 Jan 15 20:58 icinga2b.csr
-rw------- 1 icinga icinga 3243 Jan 15 20:58 icinga2b.key
[root@icinga2b pki]# openssl verify -verbose -CAfile /etc/icinga2/pki/ca.crt /etc/icinga2/pki/icinga2b.crt
/etc/icinga2/pki/icinga2b.crt: CN = icinga2b
error 7 at 0 depth lookup:certificate signature failure
140218027644744:error:0407006A:rsa routines:RSA_padding_check_PKCS1_type_1:block type is not 01:rsa_pk1.c:100:
140218027644744:error:04067072:rsa routines:RSA_EAY_PUBLIC_DECRYPT:padding check failed:rsa_eay.c:797:
140218027644744:error:0D0C5006:asn1 encoding routines:ASN1_item_verify:EVP lib:a_verify.c:233:


Gleiches auf meinem anderen Knoten icinga2a funktioniert. Auf icinga1a funktionert es reproduzierbar nicht. Die ca.cert ist auf beiden Knoten gleich.

Hat jemand eine Idee dazu?

Danke!
Marcus

Icinga web 2 - All servers are reporting the same disk usage (appears to be local server)

$
0
0
Hey Guys,

All of the servers I am monitoring with Icinga2 are reporting the same disk usage, Ping and other services appear to be working independently but the disk usage for every server is exactly the same, it appears that I have something configured wrong.

I have added a "disk-remote" section in services.conf as listed below.



apply Service "disk-remote" {
import "generic-service"

check_command = "disk"

command_endpoint = host.vars.address

assign where host.vars.location == "Denver"
}


This is the templates.conf for my Denver location


template Host "Denver" {
max_check_attempts = 3
check_interval = 1m
retry_interval = 30s
check_command = "hostalive"
/* Set custom attribute `os` for hostgroup assignment in `groups.conf`. */
vars.os = "denver"
/* Define http vhost attributes for service apply rules in `services.conf`. */
vars.http_vhosts["New UI"] = {
http_uri = "/ui"
}
/* Uncomment if you've sucessfully installed Icinga Web 2. */
vars.http_vhosts["Legacy Interface"] = {
http_uri = "/recoveryconsole"
}
/* Define disks and attributes for service apply rules in `services.conf`. */
vars.disks["disk"] = {
/* No parameters. */
}
vars.disks["disk /"] = {
disk_partitions = "/"
}
vars.disks["disk /var"] = {
disk_partitions = "/var"
}
vars.disks["disk /usr"] = {
disk_partitions = "/usr"
}
vars.disks["disk /backups"] = {
disk_group = [ "/backups", "/_Statelss" ]
disk_wfree = "12%"
disk_cfree = "8%"
}
/* Define notification mail attributes for notification apply rules in `notifications.conf`. */
vars.notification["mail"] = {
/* The UserGroup `icingaadmins` is defined in `users.conf`. */
groups = [ "icingaadmins" ]
}

and this is and example of a Denver host in the discovered_hosts.conf file


object Host "TEST" {
import "Denver"
address = "10.201.0.120"
vars.location = "Denver"
}

There are about 1000 servers in about 3 different servers in 3 different locations I am hoping to monitor, but currently they are all showing the same disk space usage. Any help at all is appreciated. ?(

Icinga ido2db psql problem: DB Version 1.14.0 does not match needed schema version 1.13.0.

$
0
0
Icinga2:

I had been doing simple "yum -y update" successfully until lately when it broke my setup. I now have the following error when I attempt to start ido2db via "systemctl start ido2db.service"

Error: DB Version 1.14.0 does not match needed schema version 1.13.0. Please check the upgrade docs!

I have been upgrading by hand for each new SQL as the upgrade file appears in /usr/share/icinga2-ido-pgsql/schema/upgrade/*

psql -U icinga -d icinga < 2.0.2.sql
psql -U icinga -d icinga < 2.1.2.sql
psql -U icinga -d icinga < 2.2.2.sql
psql -U icinga -d icinga < 2.3.2.sql
psql -U icinga -d icinga < 2.4.2.sql

I am using:
CentOS Linux release 7.2.1511
Icinga2 2.4.1
PostgreSQL 9.2.14

I am having trouble correcting this problem even though I've spent a lot of time looking at the documentation.

I'd appreciate any help.

Regards,
John

Service load und procs auf remote client wechselt ständig zwischen kritisch und ok

$
0
0
Hallo,

ich habe eine neue Icinga2-Installation (CentOS 7.1, Icinga 2.4.1 per yum von packages.icinga.org installiert, nagios-plugin-all 2.0.3 von epel), und es funktioniert bis auf die Services load und procs sehr gut. Auf den Clients läuft der icinga2-Client in der gleichen Version, und ich habe die Verbindung zum Server mittels "icinga node wizard" auf dem Client hergestellt und die Clients in zones.conf auf dem Server eingetragen (wie in der Doku unter "Master Configuration for Clients as Command Execution Bridge" beschrieben:

object Endpoint NodeName {
}

object Zone ZoneName {
endpoints = [ NodeName ];
}

object Endpoint "node208.local" {
host = "node208.local"
}

object Zone "node208.local" {
parent = "master03.local"
endpoints = [ "node208.local" ]
}


Bei den 2 Services wechselt der Status für alle Clients ca. einmal pro Minute zwischen kritisch und ok, und es sieht für mich so aus, als wechselten die Grenzwerte zwischen den Defaults und meinen konfigurierten Werten, also z.B. (per copy/paste aus dem Web-GUI):

OK
seit 0m 33s
Service: load
Ausgabe des Plugins
OK - load average: 17.00, 17.00, 17.00

Performancedaten
Label Wert Warnung Kritisch
load15 17.00 24.00 25.00
load5 17.00 24.00 25.00
load1 17.00 24.00 25.00


KRITISCH
seit 0m 17s
Soft 1/5
Service: load
Ausgabe des Plugins
CRITICAL - load average: 17.00, 17.00, 17.00

Performancedaten
Label Wert Warnung Kritisch
load15 17.00 3.00 4.00
load5 17.00 4.00 6.00
load1 17.00 5.00 10.00

Die Historie sieht dann z.B. so aus:

OK
vor 0m 20s
node208.local: procs
[ 1/5 ] PROCS OK: 997 processes
OK
vor 0m 29s
node208.local: load
[ 1/5 ] OK - load average: 17.00, 17.00, 17.00
KRITISCH
vor 0m 48s
node208.local: load
[ 1/5 ] CRITICAL - load average: 17.00, 17.00, 17.00
KRITISCH
vor 0m 48s
node208.local: procs
[ 1/5 ] PROCS CRITICAL: 1003 processes
OK
vor 0m 50s
node208.local: procs
[ 1/5 ] PROCS OK: 997 processes
OK
vor 0m 59s
node208.local: load
[ 1/5 ] OK - load average: 17.00, 17.00, 17.00
OK
vor 1m 20s
node208.local: procs
[ 1/5 ] PROCS OK: 997 processes
OK
vor 1m 29s
node208.local: load
[ 1/5 ] OK - load average: 17.00, 17.00, 17.00
KRITISCH
vor 1m 48s
node208.local: load
[ 1/5 ] CRITICAL - load average: 17.00, 17.00, 17.00
KRITISCH
vor 1m 48s
node208.local: procs
[ 1/5 ] PROCS CRITICAL: 1003 processes

Der Messwert selbst ist absolut ok, und ich kann den Status auf Grund des Vergleichs mit den Grenzwerten auch nachvollziehen, aber warum wechseln die Grenzwerte jede Minute einmal kurz zurück auf die Default-Werte?

Meine Host-Konfiguration enthält:

address = "node208.local"
vars.os = "Linux"
vars.load_wload1 = 24
vars.load_wload5 = 24
vars.load_wload15 = 24
vars.load_cload1 = 25
vars.load_cload5 = 25
vars.load_cload15 = 25
vars.procs_warning = 1100
vars.procs_critical = 1500
vars.remote_client = "node208.local"


Die Service-Konfiguration ist:

apply Service "load" {
import "generic-service"

check_command = "load"
if (host.vars.remote_client) {
command_endpoint = host.vars.remote_client
}

assign where host.address && host.vars.os == "Linux"
}

Ich sehe das jetzt für 2 Testclients, und wenn ich nur die beiden hätte, dann wäre das nicht so tragisch, aber wenn ich für mehrere Dutzend Clients jeweils 2 Statuswechsel pro Minute habe, dann verwässert mir das den Blick auf die "echten" Probleme.

Ich bin für jede Hilfe dankbar, was ich zum Beheben des Problems anschauen und verändern könnte.

Icinga 2 Windows Agent in VMWare Images vorinstallieren?

$
0
0
Moin!

Ist es möglich einen Icinga 2 Windows Agent (command bridge aus der ha master zone mit zwei nodes) in einem VMWare Template so vorzuinstallieren, dass er unabhängig vom späteren Hostnamen der VM funktioniert?

Das Prozedere über die Generierung eines Tickets auf Basis des Hostnames der VM ist so für mich nicht gangbar und soweit ich verstehe muss der CN Parameter bei der Ticketgenerierung zum "Instance name" im Wizard und zum Hostnamen passen.

Auch müsste ich Hunderte existierender Server mit dem Windows Agent versorgen - das könnte man zwar über ein Skript mit Ticketgenerierung hinbekommen, einfacher wäre es aber nur das Agent Setup auszuführen und die für alle Server gleiche Konfiguration in das etc Verzeichnis zu schieben.

Danke!
Marcus

zones.conf bei HA cluster mit configuration sync und command execution bridge

$
0
0
Moin!

Mein geplantes Setup:

* Zone "master" mit endpoint icinga2a und icinga2b
* icinga2a ist configuration master
* Viele Windows server mit Icinga 2 Agents die über command execution bridge checks für den jeweiligen Windows server im Auftrag von icinga2a und icinga2b ausführen
* hosts.conf (und weitere Dateien unterhalb von zones.d) wird regelmässig über ein Skript aus Daten eines NW-Inventarierungstools generiert

Die zones.conf liegt auf icinga2a und icinga2b in /etc/icinga2/. Für alle Windows hosts muss ich endpoints und zones in zones.conf definieren, aber die Datei zones.conf wird natürlich nicht von icinga2a nach icinga2b synchronisiert, weshalb nur icinga2a meine Windows endpoints/zones kennt.


zones.conf nach zones.d/master zu verschieben geht wohl auch nicht - wie soll Icinga beim Start wissen in welche zones.d Unterverzeichnisse es schauen soll wenn es noch keine zones.conf hat?


Übersehe ich etwas oder muss ich zones.conf tatsächlich selbst auf icinga2b kopieren und kann nicht die config sync dafür nutzen?


Danke!
Marcus

Link between 2 maps

$
0
0
Hello,

I'm a french student who work on shinken and i have a little problem with nagvis.

I have one big maps to represent all sites of my entreprise, and one map per site.

I can see on sites differents services on hover, but on the big map, all of my hosts are "no service" :


This is one of my hosts with his services :


But on the big map i have that :



There is no communication between theses two maps for services.

I think the problem is hover_template.

Do u have any idea to solve this problem ?

Regards,

Kryo

PS : Sorry for my english :/

Manual check_mk install not showing hosts via multisite

$
0
0
Hi,

We have a multisite install of Nagios 3.4.4 and check_mk 1.2.2p2 running which currently connects (and displays all info) on 2 remote sites.

We have recently added a 3rd remote site but are not seeing any host data returned to our UI via multisite, if we manually add hosts to the Nagios cfg files on the remote site we see these and if we login to the check_mk URL as nagiosadmin on the remote site we see all the hosts.

I suspect there is some kind of permissions issue which is stopping our UI showing the host data passed back over the interface, anyone seen anything like this before?

icinga2 graphite, metadata, state etc.

$
0
0
Hallo zusammen,

vielleicht habe ich da einen Denkfehler:

Setup
icinga2 mit graphite und perfdata feature
influxDB
grafana

Setup läuft soweit, system spuckt mir schöne Diagramme aus. (s. Anhang)

[attach]7645[/attach]

So, ich übertrage die Metadaten ebenfalls. Was ich jetzt bauen möchte ist eine Übersicht über die Verfügbarkeit/Jahr also sowas wie 99,7% Verfügbar.
Dazu müsste mir Icinga ja, wenn ein host/service down ist, entsprechende status daten nach influx übertragen. Es gibt z.b. in den Metadaten "reachable" oder "state".
Aber, ich habe z.b. auf einem System den SMTP dienst deaktiviert um zu prüfen, welche Daten ich empfange. Es hat sich aber nichts verändert. (Anhang) um 12:12 Uhr war der SMTP Dienst erreichbar, danach nicht mehr. Icinga meldet aber immnoch "reachable" = 1
Interpretiere ich die gelieferten Daten falsch ?

[attach]7646[/attach]

Danke im Voraus !

VG, Andre

HACluster, mit Nodewizard installieren

$
0
0
Hallo zusammen, ich versuche derzeit ein HA cluster mit 2 Master Icinga2 Instanzen ans laufen zu bekommen.

ich habe als Referenz dasWebinar Video von Netways genutzt und die Doku.

meine 1. VM (icingatestvm) wurde mit dem icinga2 node wizard und der "n" Option genau wie meine 2. VM (icingatestvm2) installiert da ich ja 2 Master Systeme haben möchte. Anschließend hab ich die Konfigurationen wie im Video auf meine Hostnamen angepasst angelegt. Accept_config und accept_commands ist in beidem VM's = true.

Leider aber funktioniert die Kommunikation zwischen den beiden Instanzen nicht :

Logauszug icingatestvm2 : (/var/log/icinga2/icinga2.log)

Quellcode

1
2
3
[2016-01-18 15:05:14 +0100] information/JsonRpcConnection: Reconnecting to API endpoint 'icingatestvm' via host '192.168.122.81' and port '5665'
[2016-01-18 15:05:14 +0100] information/ApiListener: New client connection for identity 'icingatestvm' (unauthenticated)
[2016-01-18 15:05:14 +0100] information/ApiListener: New client connection for identity 'icingatestvm' (unauthenticated)


Nun komm ich zu meiner eigentlichen Frage:

Muss man ,wenn der node wizard genutzt wird, die 2. Instanz als sattelite setup durchführen, auch wenn dieser ein Master sein soll? Sprich 1. VM: icinga2 node wizard mit N beantworten, 2. VM mit Y beantworten? Oder hab ich da etwas total missverstanden?

Ich denke das meine Zertfikate nicht ausgetauscht sind und somit die beiden einzelnen Instanzen sich gegenseitig nicht kennen können.(Macht das der node wizard bei einem "sateliete" config?)

Falls noch weitere Informationen benötigt werden, einfach nachfragen :)

PS. Falls es relevant ist, mein Vorhaben soll ein Cluster aus 2 Icinga Installation sein welche im Falle das eine Instanz auf Grund von Netzwerkproblemen / Ausfall etc. nicht mehr funktioniert ich dennoch mit der anderen Instanz über meine einzelnen Hosts informiert werde. Die beiden Installationen sind auch räumlich getrennt.

Vielen Dank für die Hilfe

api output attrib on regional lang

$
0
0
hi all,

On my Icinga server display_name host or service write on Russian lang.

When i see it host or services name on IcingaWeb, i see it correct.

When i try curl or powershell api request
display_name Russian letters is not displayed correctly

example:
Icinga Web - Сайт www.rosconcept.ru
curl - "\u0421\u0430\u0439\u0442 www.rosconcept.ru"
powelshell - Сайт www.rosconcept.ru

what you need to do for correct display Russian names?

check_postgres

$
0
0
Hi,

How do I convert this configuration from icinga1 to icinga 2.


define command {
command_name check_postgres_locks
command_line $USER2$/check_postgres.pl -H $HOSTADDRESS$ -u pgsql -db postgres --action locks -w $ARG1$ -c $ARG2$
}



define service{
use generic-other
host_name dbhost.gtld
service_description dbhost PostgreSQL Service Database Locks
check_command check_postgres_locks!2!3
}




Thanks in advance.

Multiple hiearchies with top-bottom configurations synchronization: which node connection?

$
0
0
Hello,
after a lot of time reading the forum, I've created my account. I would really like to have a unified solution to monitor all my hosts and Icinga2 seems perfect for that.

I'm currently experimenting with multiple hierarchies and top-bottom synchronization. I tested a two levels configuration (master-satellite) and it works perfectly. But I'd like to have some insights about node connections for a three levels hierarchy.
I'd like to have three zones (with at least one endpoint for each) :

- global master
---- local master
------- local satellite

In this configuration, I generated all the needed configuration on the "global master": zones and endpoints definitions in its zones.conf and monitoring configurations in its /zones.d folder.
On the "local master", I configured properly the zones.conf file, the same for "local satellite", and activated the accept_config in the api feature for both.

My question is, how should I connect the "local satellite" node so that it interacts with the "local master"? I'd like it to synchronize configuration, and send monitoring data, to the "local master". I tried to connect the "local satellite" node to the "local master" (generate the ticket on "local master", ask it to sign certificates, etc.). But then, the "local master" does not send the "local satellite" its configuration. The "local master" correctly receives its configuration to the master. But how to "ask him" to propagate the "local satellite" configuration to its child node?

Thanks a lot for your help.

Understanding the backend

$
0
0
Hi,

I'm currently testing out Icinga 1.3 on a development server using the classic UI and Icinga Web with IDOUTILS, but I'm having
trouble grasping how the backend of things work.

I was under the impression that all the monitoring data is stored in a database, but I just had my MySQL service stop, and I was suprised that, although the Icinga Web stopped working, the classic UI still seemed to be functioning fine.

Is the classic UI still using flat files and the new Web using a database? If so, isn't this going to put more load on the server with I/O?

Also, if this situation happens again (the SQL service dying), when I start it again, will the classic and new web be out of sync with service acknowledgments, comments etc that happend whilst the service had stopped?

Verständnis: Notification/-interval

$
0
0
Hallo,

Ich hab Icinga2 auf debian8 laufen, Services/Checks usw. wurde alles erfolgreich migriert (von Nagios) und Notifications/Escalations neu erstellt.
Gestern Nacht hatten wir dann einen Switch-Ausfall, aber es wurde nicht eskaliert, deshalb jetzt eine Verständnisfrage.

Die Konfiguration kann man sich ungefähr so vorstellen:

Quellcode

1
2
3
4
5
6
7
8
9
10
11
12
13
apply Notification "switch-notification" to Host {
	import "generic-host-notification" //command, states, types, ...
	interval = 0 //könnte das der problematische Part sein?
	assign where host.name == "switch"
}

apply Notification "switch-escalation" to Host {
	import "generic-host-notification"
	interval = 60s
	times.begin = 5m
	times.end = 10m
assign where host.name == "switch"
}


Kurz gesagt: Ist der Host 5min nicht erreichbar, schicke 5min lang jede Minute eine SMS raus. Genau das ist NICHT passiert, es lag auch nicht am SMS-versenden-Skript oder Ähnlichem, da die Notifications nirgendwo angezeigt wurden (Web UI, Log, ...).

Meine Vermutung: Durch die Verwendung von "interval = 0" in der ersten Notification werden für das gesamte Host-Objekt ALLE Notifications unterbunden. Gewollt ist eigentlich nur, dass definitiv nur EINE Mail verschickt wird. Wenn ich sowas in Richtung times.begin = 0m, times.end = 1m, interval = 5m konfiguriert habe, kamen ZWEI E-Mails (warum auch immer)

Frage:
1.: Stimmt meine Vermutung?
2.: Ist das gewolltes Verhalten?
3.: Wenn 2. ja: Wie kann ich das machen was ich machen will?
4.: Wenn 2. nein: Wann kommt ein Fix?

OffTopic:
Wann ist mit einem Fix für Bug#7287 zu rechnen? Der ist 1 Jahr alt und der Arbeitsaufwand wurde auf nur 2h geschätzt. Und dabei handelt es sich definitiv um Unexpected Behaviour.

Grüße und Danke im Voraus,
mario (mit lästigem Unterstrich)

rta nan, lost 100% - Host down Meldung obwohl Host erreichbar ist

$
0
0
Guten Tag,

ich habe mir einen check_mk System für unser Umfeld eingerichtet. Soweit funktioniert alles prima, leider finde erhalte ich regelmäßig (alle 2-5 min) "rta nan, lost 100%"Meldungen von Systemen, die online und auch ordentlich erreichbar sind.

Wo kann ich hier ansetzten, um diese Flut an Meldungen zu minimieren?

Danke vorab für die Unterstützung.

Grüße

Christian

HW/SW Inventory Plugin fails with error invalid literal for int() with base 10: ''

$
0
0
Hi all,
we use check_mk raw 1.2.6p15 with 96 hosts.
On 40 Windows Hosts the HW / SW Inventory Plugin runs smoothless without any problems, but on 3 clients we do not get any inventory information.
The Plugin fails with invalid literal for int() with base 10: ''.

Doing a cmk --debug -vv -i {HOSTNAME} does print out the following error:

Quellcode

1
2
3
4
5
6
7
8
9
10
11
12
13
OMD[SITE]:~$ cmk --debug -vv -i HOSTNAME
Doing HW/SW-Inventory for HOSTNAME...Connecting via TCP to HOSTNAME:6556.
Persisted sections win_disks, win_video, win_system, win_bios, win_exefiles, win_os, win_cpuinfo, win_reg_uninstall, win_wmi_software.
win_system win_reg_uninstall win_os win_video mem win_disks Traceback (most recent call last):
  File "/omd/sites/hfm/share/check_mk/modules/check_mk.py", line 5714, in <module>
	do_inv(hostnames)
  File "/omd/sites/hfm/share/check_mk/modules/inventory.py", line 178, in do_inv
	do_inv_for(hostname, ipaddress)
  File "/omd/sites/hfm/share/check_mk/modules/inventory.py", line 242, in do_inv_for
	plugin["inv_function"](info)
  File "/omd/sites/hfm/share/check_mk/inventory/win_disks", line 80, in inv_win_disks
	array["size"] = int(value)
ValueError: invalid literal for int() with base 10: ''


Due to security reasons I replaced SITE and HOSTNAME.

It seems that the "win_disks" script does get something different than expected.

All three hosts does have a card reader device, which simulates disks in windows, but mybe does not have any card plugged in during inventory.

Could I deactivate these devices from inventory? How?
Any ideas?

Greetings,
PifPof
Viewing all 1338 articles
Browse latest View live