提要
无监控不运维! 告别”救火员“的运维
二次搭建zabbix了,这次打算以zabbix(集团基础硬件为主)+prometheus(k8s+微服务集群为主)+grafana(dashbroad展示)架构,对集团各层面进行监控
先弄zabbix部分,首先明确监控体系搭建以及使用的大致过程
搭建监控系统(zabbix&Prometheus)—>添加被监控机(网络设备、服务器、window/linux客户端、哑终端)—>触发器报警机制—>dashbroard展示—>监控趋势数据分析。
环境
ubuntu 20.04
zabbix.6.0ITS
zabbix-agent/agent2
监控范围
window:10/2016
linux:centos7/ubuntu20.04/22.
vmware vSAN/ESXI
各业务虚拟机
这些模板,自个到网上down。太多了
一、zabbix-server安装
这个过程太简单了!暂且不表,其他博客也都有,虽然某些环节藏私,但是多想想就能搭建成功。
二、zabbix监控
2.1 snmp监控华为S7706\S5735系列交换机、USG系列防火墙
2.1.1 交换机、防火墙开启snmp协议 (snmpv2/snmpv3)
懒,所以直接web界面搞,命令行有点生疏
使用SNMPv3协议,配置组、用户及认证协议:认证SHA、加密AES
2.1.2导入交换机、防火墙MIB模板+添加监控host
添加host
成功添加,显示状态(其中成功的标志是 可用性 SNMP 并且为 绿色)
在dashboard中查看获取到的监控数据
监控到的数据信息
其中监控数据来源比如端口进出流量、丢包率、延迟等,可以选择性关闭,避免不必要的监控数据堆积。
2.1.3 zabbix监控华为网络设备完成
2.2 snmp监控华为服务器
上次就卡在这里,念念不忘,百战百败…还是搞定了。。。
2.2.1导入Mib模板
配置模板
2.2.2 华为服务器snmp配置
(SNMPv3不知道为毛,配置认证和加密之后,使用SNMP获取就失败,使用snmpv2c就正常)不过后期在继续改进吧。
服务管理—SNMP-团体名与模板 团体名保持一样
2.2.3zabbix-添加host
继承宏
添加成功
查看监控数据