系统简介:zabbix是一个企业级解决方案,支持实时监控数千台服务器,虚拟机和网络设备采集百万级监控指标。
Zabbix的主要特点有:
- 指标收集:从任何设备、系统、应用程序上进行指标采集;
- 问题监测:定位智能阀值;
- 可视化:单一界面管理平台;
- 告警和修复:确保及时,有效的告警
- 安全和认证:保护您所有层级的数据
- 轻松搭建部署:大批模板、开箱即用、节省您宝贵的时间
- 自动发现:自动监控大型动态环境
- 分布式监控:无限制扩展
名词术语
Zabbix 系统有一些自己定义的专业术语,为更好的熟悉系统名词,下面主要介绍本文以及zabbix常用的术语。
主机(host)
一台你想监控的服务器、工作站、交换机等网络设备,用IP或者域名表示。
主机组(host group)
多台具有某种相同角色、属性的集合。例如,所有Windows服务器放在一个叫“Windows server”的主机组中。
监控项(item)
你想要监控、获取主机或者主机组的哪些数据。例如:我想要监控所有机器的CPU使用情况,则需要建一个监控项,用于获取所有服务器的CPU使用率。
触发器(trigger)
由逻辑表达式组成的按照预先设置好的阀值来评估由监控项采集到的数据。触发器有两种状态,分别为“问题”和“已解决”。例如:在上述通过监控获取了CPU的使用率,例如我想超过CPU使用超过80%的就预警,则可以创建一个触发器,当监控项获取的值超过80%时就按照预设的情况报警,状态为“问题”,低于80%时认为报警解除,状态恢复为“已解决”。
事件(event)
单次发生的需要注意的事情,例如上述触发器状态由问题变成了正常或者由正常变成了问题,均可以称为一个事件。事件包括触发器事件、自动发生事件、自动注册事件和内部事件4个部分。
动作(action)
一个对事件做出反应的预定义的操作:例如CPU使用超过80%时,触发器状态变成了问题,即产生了一个事件,我们可以针对此事件预设一个动作(比如执行命令reboot),则系统全自动针对此事件的预设作执行命令reboot。
Zabbix server
Zabbix 系统实现监控的核心程序,主要功能是与被监控主机、代理机等进行交互、触发器计算、发送告警通知、收集数据并存储等。
Zabbix agent
一个部署在监控对象上的,能够主动监控本地资源和应用的程序;一般来讲,我们需要在所
有被监控服务器上安装此程序。
1.关闭防火墙和selinux