一、监控系统需要监控那些数据
1、系统本地资源:负载(uptime)、CPU(top、sar)、磁盘(df -hi)、内存(free)、I/O(iostat)、Raid内磁盘故障、CPU温度、passwd文件的变化、本地所有文件改动。
2、网络服务:端口、Web(URL)、DB、ping包、进程、IDC带宽网络流量。
3、其它设备:路由器、交换机(端口、光衰、日志)、打印机、Windows等。
4、业务数据:用户登录失败次数、用户登录网站次数、输入验证码失败的次数,某个API接口流量并发、网络连接数、IP、PV数、电商网站订单,支付交易的数量等。
二、Nagios的特点
1、监控网络服务(HTTP、TCP、PING、SMTP、POP3等)
2、监控主机资源(CPU、负载、I/O状况,虚拟及正式内存及磁盘利用率等)
3、简单的插件设计模式使得用户可以很方便地定制符合自己服务的检测方法
4、并行服务检查机制
5、具备定义网络分层结构的能力
6、具备定义事件句柄能力
7、自动的日志回滚
8、可以支持并实现对主机的冗余监控(支持分布式监控)
9、可选的WEB界面用于查看当前的网络状态。通知和故障历史、日志文件等。
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
未完待续。。。。