常用告警
Linux key
CPU 使用率
system.cpu.util[,user]
DISK 使用率
100*(last("vfs.fs.size[{#FSNAME},used]"))/last("vfs.fs.size[{#FSNAME},total]")
MEM swap使用率
100-avg("system.swap.size[,pfree]",60)
MEM 使用率
vm.memory.size[pused] # active + wired 总内存的百分比pused=(total -freee)/total %
Process nginx
proc.num[,,,"nginx"]
proc.num
windows key
CPU UTL
perf_counter["\Processor Information(_Total)\% Processor Time"]
Process aaa
service.info["aaa"]
对于Windows server监控需要取server名称
1:打开任务管理器,找到services,找到需要监控的process点击它,然后鼠标右键点击 go to details
2:跳转到details后点击process,右键点击properties
下面红框内值则是zabbix 监控需要的key
trigger: key使用 min(#3)<>0 #因为item取值是running(0),不为0就会告警
Calculated计算类型
内存
对于监控项,有些监控数据zabbix模板里并没有,但是我们可以通过计算获取到为们想要的数据
比如:Memory 模板里有total,available,并没有使用里多少,所以我们可以通过计算得到Memory的使用率
公式: 100*(total - available) /total
实际应用例如下面的:
100*(avg("vm.memory.size[total]",60)-avg("vm.memory.size[available]",60))/avg("vm.mem