Hadoop监控之Nagios 与 Ganglia 整合

本文介绍了如何整合Nagios和Ganglia进行系统监控。Nagios作为监控中心,依赖插件进行监测,通过NRPE与被监控主机通信。文章详细阐述了Nagios的安装过程,包括主监控机和被监控机的配置,并强调了Nagios配置文件的重要性,如服务、主机、联系人和命令对象的定义。同时,提到了自定义监控脚本的返回值规则以及Nagios与Ganglia集成的相关资源链接。
摘要由CSDN通过智能技术生成

Nagios架构

这里写图片描述
Web : 用户通过web界面来管理Nagios
Database:被监控的数据放入数据库
右边的框代表被管理的机器,针对Llinux上的监控进程时NRPE。
负责获取监控数据或者执行命令,NRPE和Nagios Server 通过SSL协议来进行监控和命令执行的信任授权。
这里写图片描述
– Nagios是一个监测的管理中心,但是他自身并不包括具体的检查的代码。也就是说:所有的监测、监测功能都是由相关插件来完成的。Nagios自身也没有报警部分的代码和插件,而是交给用户或者其他相关开源项目组去完成。他只是去监控相应的插件,触发监控动作和处理返回值,从而到达监控的效果。
– 它是一个框架,插件粘合剂。

Nagios安装

主监控机
– yum install nagios nagios-plugins nagios-plugins-all nagiosplugins-nrpe nrpe
– service nagios start; service httpd start
– 访问http:///nagios/,默认用户名密码都是:
nagiosadmin
被监控机
– yum install nagios-plugins nagios-plugins-nrpe nrpe nagiosplugins-load nagios-plugins-disk nagios-plugins-swap
– /etc/nagios/nrpe.cfg添加允许访问的机器地址或域名:
• allowed_hosts=127.0.0.1,Hagrid01
– 启动nrpe守护进程
• nrpe -c /etc/nagios/nrpe.cfg -d
同过 ps ax | grep nrpe 查看一下是否启动正常
• 从监控机执行命令检查被监控机nrpe是否正常
: /usr/lib64/nagios/plugins/check_nrpe -H <被监控机IP>
配置检测
通过这个命令可以检查配置是否有误。
– nagios -v /etc/nagios/nagios.cfg

经过以上简单的配置(启动 nagios 和 httpd 服务,以及启动nrpe监控服务后),就可以查看当前web监控页面了:
这里写图片描述

Nagios配置及使用说明

• 主配置文件:/etc/nagios/nagios.cfg
• Resouce定义文件:包含宏定义
• Object定义文件
• CGI定义文件
这里写图片描述

理解Nagios主配置文件:
log_file=/var/log/nagios/nagios.log  # log地址
# 所有的object配置文件,例如:
cfg_file=/etc/nagios/objects/commands.cfg                                                              
cfg_file=/etc/nagios/objects/contacts.cfg                                                                 
cfg_file=/etc/nagios/objects/timeperiods.cfg                                                                      
cfg_file=/etc/nagios/objects/templates.cfg  
# resource配置文件
resource_file=/etc/nagios/private/resource.cfg 
Object定义文件

Object有以下几种类型:
Services、 Service Groups、 Hosts、 Host Groups、 Contacts、 Contact
Groups、 Commands、Time Periods、Notification Escalations、Notification
and Execution Dependencies

注意:附上的参考连接中红色的部分是必填部分

Service : 对监控节点上的service的监控
https://assets.nagios.com/downloads/nagioscore/docs/nagioscore/4/en/objectdefinitions.html#service

Host:对监控节点本身的监控
https://assets.nagios.com/downloads/nagioscore/docs/nagioscore/4/en/objectdefinitions.html#host

Contact:定义监控报告发给哪些人
https://assets.nagios.com/downloads/nagioscore/docs/nagioscore/4/en/objectdefinitions.html#contact

Command:执行一个命令
https://assets.nagios.com/downloads/nagioscore/docs/nagioscore/4/en/objectdefinitions.html#command

这里写图片描述

自定义监控脚本的通过执行返回值来告知nagios检测对象的状态:0-正常 1-警告 2-严重错误 3-未知错误

command存放于 /usr/share/ganglia/nagios 下
https://github.com/ganglia/monitor-core/wiki/Ganglia-Nagios-Integration

hbase监控相关指标http://blog.csdn.net/wuwenxiang91322/article/details/46425403

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值