Nagios 监控平台搭建实验
前言
本文重点在于NagioS监控平台的工作原理与运行原理,后面会将详细的搭建流程展示,如有错误和遗漏的地方,欢迎大家指正,谢谢。
基础理论说明
Nagios是什么?
Nagios是一个监视系统运行状态和网络信息的监视系统。Nagios能监视所指定的本地或远程主机以及服务,同时提供异常通知功能等
Nagios可运行在Linux/Unix平台之上,同时提供一个可选的基于浏览器的WEB界面以方便系统管理人员查看网络状态,各种系统问题,以及日志等等。
工作原理
Nagios的功能是监控服务和主机,但是他自身并不包括这部分功能,所有的监控、检测功能都是通过各种插件来完成的。
启动Nagios后,它会周期性的自动调用插件去检测服务器状态,同时Nagios会维持一个队列,所有插件返回来的状态信息都进入队列,Nagios每次都从队首开始读取信息,并进行处理后,把状态结果通过web显示出来。
Nagios提供了许多插件,利用这些插件可以方便的监控很多服务状态。安装完成后,在nagios主目录下的/libexec里放有nagios自带的可以使用的所有插件,如,check_disk是检查磁盘空间的插件,check_load是检查CPU负载的,等等。每一个插件可以通过运行./check_xxx –h 来查看其使用方法和功能。
Nagios可以识别4种状态返回信息,即 0(OK)表示状态正常/绿色、1(WARNING)表示出现警告/黄色、2(CRITICAL)表示出现非常严重的错误/红色、3(UNKNOWN)表示未知错误/深黄色。Nagios根据插件返回来的值,来判断监控对象的状态,并通过web显示出来,以供管理员及时发现故障。
监测方式
主动模式(NSCA)
主动模式不需要调用客户端的插件,而是通过自己的插件主动去探测客户端的相关信息。
被动模式(NRPE)
客户端起nrpe进程,服务端通过check_nrpe插件向客户端发送命令,客户端根据服务端的指示来调用相应的插件,插件可以获取到本机的相关信息,并把获取到的结果发送给服务端。因为需要调用客户端的插件去等带客户端返回的信息,所以叫做被动模式
根据不同操作系统制定对应监测方案
上述描述的监测方案适用于linux/unix,nagios还可以通过不同的监控方案来监测不同系统平台。
应用场景
主动模式:一般用于监控Web服务,数据库等这些对外提供服务的监控,如:httpd,mysqld,sshd等
被动模式:一般用于监控本地资源,例如负载,内存,硬盘,虚拟内存,磁盘IO,温度,风扇等的监控(我们也可以通过snmp实现监控部分系统资源)。
实验步骤
实验目的:掌握Nagios监控平台搭建流程
实验准备:两台C6标准虚拟机(防火墙与selinux已关闭)
主机规划:
服务器角色 | 简称 | IP |
---|---|---|
监控机 | MC(Monitor Server) | 192.168.10.10 |
被监控机 | MS(Monitor Client) | 192.168.10.11 |
一、配置Nagios监控机
安装相关依赖、创建运行身份
yum -y install httpd gcc glibc glibc-common php php-mysql openssl openssl-devel lrszs
cd /mnt/cdrom/Packages/
yum -y install *gd* # 该依赖直接使用yum安装会报错