详细描述user parameters、定义主机发现规则实现自动发现、如何定义和实现自动注册方式
zabbix常用术语
1、主机(host):要监控的网络设备,可有IP或DNS名称指定;
2、主机组(host group):主机的逻辑容器,可以包含主机和模板,但同一个组内的主机和模板不能互相连接;主机组通常在给用户或用户组指派监控权限时使用;
3、监控项(item):一个特定监控指标的相关数据,这些数据来自于被监控对象;item是zabbix进行数据收集的核心,没有item,将没有数据;相对某监控对象来说, 每个item都有"key"进行标识
4、触发器(trigger):一个表达式,用于评估某监控对象的某特定item内所接收到的数据是否在合理范围内,即阈值;接收到的数据量大于阈值时,
触发器状态将从"OK"转变为"problem",当数据量再次回归到合理范围时,其状态将从"problem"转换回"OK";
5、事件(event):即发生的一个值得关注的事情,例如触发器的状态转变,新的agent或重新上线的agent的自动注册等;
6、动作(action):指对于特定事件事先定义的处理方法,通过包含操作(如发送通知)和条件(何时执行操作);
7、报警升级(escalation):发送报警或执行远程命令的自定义方案,如每隔5分钟发送一次警报,共发送5次等;
8、媒介(media):发送通知的手段或通道,如Email、jabber或SMS等;
9、通知(notification):通过选定的媒介向用户发送的有关事件的信息;
10、远程命令(remote command):预定义的命令,可在被监控主机处于某特定条件下时自动执行;
11、模板(template):用于快速定义被监控主机的预设条目集合,通常包含了item、trigger、graph、screen、application
以及low-level discovery rule(低级别发现规则,相当消耗资源,一般不用);模板可以直接连接至单个主机;
12、应用(application):一组item的集合;
13、web场景(web scennario):用于检测web站点可用性一个或多个HTTP请求;
14、前端(frontend):zabbix的web接口
zabbix启动的进程
Item key:
命名要求:只能使用字母、数字、下划线、点号、连接符
接受参数:system.cpu.load[<cpu>,<mode>], net.if.inbound[if,<mode>]
注意:每一个key背后都应该有一个命令或脚本来负责实现数据收集;此命令(system.cppu.load)或脚本可调用传递给key的参数(if,<mode>),调用方式为$1,$2,...
在zabbix中定义item时调用某key,还需要额外定义数据采集频率、历史数据的保存时长等信息;
Trigger:
触发器表达式:{<Server>:<key>.<function>(<parameter>)}<operator><constrant> //被监控服务器上的key所对应的数据,被函数表达式所调用的参数处理之后的结果,与某个所期望的数值作比较。
被监控服务器 调用函数 参数 操作符 指定数据范围值
{192.168.128.132:net.if.in[ens33,bytes].last(#1)}>1200
//192.168.128.132是被监控的服务器; net.if.in[ens33,bytes]是key; last(#1)是函数,表示取最后一次的数据; >是操作符; 1200是所指定的数值,也可以定义为宏
<function>:评估采集到的数据是否在合理范围内时所使用的函数;其评估过程可以根据采集到的数据、当前时间
count、change、date、dayofweek、dayofmonth、delta、diff、iregexp、regexp、last、max、min、nodata、now、sum、strlen
avg:可以采样做平均值;
regexp:检查最后一次采样的数据是否能够被指定的模式所匹配,1表示匹配,0表示不匹配;
now:返回自Unix元年至此刻经历的秒数;
prev:倒数第二个采样值;
str:从最后一次的采样中查找此处指定的字串;
<operator>:操作符
>、<、=、#(不等于)
/、*、-、+
&(与)、|(或)
触发器间有依赖关系:
Action
- message
- condition 由event触发,包括:trigger、discovery、auto_registration、lid
- discovery包括:service up、service down、host up、host down、service discovered、service lost、service discovered、host lost
- operation:
- send message:
- Media type:Email、SMS、Jabber、Script、EZ Texting
Script:Alert Script 必须放到特定目录中:AlertScriptsPath=/usr/lib/zabbix/alertscript
zabbix_server.conf配置文件中的参数
脚本中可使用$1,$2,$3来调用 action 中的, $1表示邮件的收件人,$2表示Default Subject,$3表示Default Message;
注意:新放入/usr/lib/zabbix/alertscript目录的脚本,只有重启zabbix-server方能被使用
- User
- remote command:
(1)zabbix server主机远程被监控主机(zabbix agent),那么命令在被监控主机上运行,这个命令就是由zabbix agent进程生成的,运行zabbix agent进程的用户是zabbix用户,所以这里指定的远程命令zabbix 用户不一定有权限执行,所以要给zabbix定义sudo规则,在每一个agent主机上都应该添加zabbix用户在任意主机上以任意用户的身份运行任意命令。 zabbix ALL=(ALL) ALL
(2)不支持active模式的agent;
(3)不支持带来模式
(4)命令长度不得超过255个字符
(5)可以使用宏;
(6)zabbix-server仅执行命令,而不关心命令是否执行成功
使用脚本报警:http://www.ywnds.com/?p=6574 http://www.51niux.com/?id=153
前提:zabbix-agent要配置为支持执行远程命令; https://www.zabbix.com/documentation/3.4/zh/manual/config/notifications/action/operation/remote_command
注意:
(1):如果用到以其他用户身份执行命令的话,那么命令本身要以sudo方式运行;
sudo /usr/sbin/apachectl restart
(2)在各agent上的sudoers文件,要注释如下行:
Defaults requiretty
示例:监控node2主机上即zabbix agent端的httpd服务器是否启动,如果没有启动server端则执行远程命令重启agent端的httpd服务
# vim /etc/zabbix/zabbix_agentd.conf
EnableRemoteCommands=1
LogRemoteCommands=1 //是否记录远程命令执行的日志,1表示记录
# systemctl restart zabbix-agent
每一个item key的官方文档:https://www.zabbix.com/documentation/4.0/manual/config/items/itemtypes/zabbix_agent
想要让server端远程重启agent端的httpd服务,那么server端首先要监控httpd服务。可以基于最后一次采样的值判断httpd服务的状态是否不正常,不正常则执行远程命令。
首先定义一个applications,定义http service
定义items,这里监听的是httpd服务的80端口,即80端口存在证明httpd服务是正常,不存在就证明http服务出现了问题
定义一个graph,查看效果
此时启动与停止httpd服务,查看效果图
定义triger
定义actions
在agent端执行# systemctl stop httpd,停掉httpd服务