zabbix 报警
创建报警流程
- 创建报警媒介类型 ,设置消息模板。
- 设置接收用户报警
- 允许动作
创建报警媒介类型 ,设置消息模板、
设置接收用户报警
允许动作
测试
登录三个用户
全网监控服务器
如何利用zabbix去监控我们整个web集群,假如我们有50台,100台机器,该怎么去监控,手动的挨个添加?肯定不行。
监控方案
问题:如何快速添加100台机器
思路:
- 克隆监控模板
- 自动注册和自动发现
- 使用zabbix和api接口,利用curl,或者python进行开发自己的运维监控平台
监控方案实施
硬件监控
zabbix自带的模板,已经包含主要的监控项
应用服务监控
1.Mysql服务器
1.监控3306端口 net.tcp.port[,3006]
2.进行登录测试,mysql -uroot -p -h
3.zabbix-agent自定义的模板
2.监控web服务器
1.监控80端口,net.tcp.port[,80]
2.通过状态码查看,如zabbix 自带的web监控
3.监控zabbix
监控 nginx 端口
监控服务通用方法
1.端口监控
使用 netstat 结合grep 查看
2.进程监控
通过ps命令结合 grep 查看
3.模拟客户端连接
web服务,通过curl 命令访问
mysql ,SQL语句验证
客户端部署
看之前的文档提前安装好 agent 并修改配置文件
自动发现 / 自动注册
自动发现
zabbix server主动发现所有客户端,然后将客户端登记自己的小本上,缺点zabbix压力大,(网段大,客户端多),时间消耗多。
自动注册:
zabbix agent主动到zabbix server 上报到,登记;缺点agent 有可能找不到server(配置出错)
两种模式
被动模式:默认agent被server抓取数据 (都是在agent的立场上说)
主动模式:agent主动将数据发到server端 (都是在agent的立场上说)
注意: 两种模式都是在agent上进行配置
hosts解析设置
客户端,服务端都给准备好
vi /etc/hosts
192.168.1.5 zabbix-server
192.168.1.6 agent02
自动发现设置
创建发现动作
等待主机
自动注册设置 主动模式
1.删除zabbix 上主机 把之前做那个 自动发现关闭
2.做好 nema解析
3.安装好 agent
4.修改配置文件
vi //etc/zabbix/zabbix_agent2.conf
PidFile=/var/run/zabbix/zabbix_agent2.pid
LogFile=/var/log/zabbix/zabbix_agent2.log
LogFileSize=0
Server=10.0.1.50
ServerActive=10.0.1.50
Hostname=jumpserver
HostnameItem=system.hostname #比之前多一行
Include=/etc/zabbix/zabbix_agent2.d/*.conf
ControlSocket=/tmp/agent.sock
5.重新启动 agent 2
systemctl restart zabbix-agent2
在zabbix 配置
选择 发现行动
添加操作
最后等待客户端 添加
验证成功