被监控服务器
定义检查datanode日志命令
vi /usr/local/nagios/etc/nrpe.cfg
command[check_datanode_log]=/usr/local/nagios/libexec/check_log -F /var/log/hadoop-hdfs/hadoop-hdfs-datanode-`hostname`.log -O /var/nagios/oldlog/hadoop-hdfs-datanode-`hostname`.log -q ERROR
mkdir -p /var/nagios
chmod 777 -R /var/nagios/
nagios服务器
services.cfg
define service{
use local-service
hostgroup_name hadoop-slave ; 指定要监控哪个主机上的服务,“Nagios-Server”在hosts.cfg文件中进行了定义。
normal_check_interval 1
service_description datanode log check ; 对监控服务内容的描述,以供维护人员参考。
max_check_attempts 1
notification_options w,u,c
check_command check_nrpe!check_datanode_log ; 指定检查的命令。
}
nagios服务器通过nrpe插件与被监控服务器的nr