zabbix-server | 172.16.1.71 |
---|---|
zabbix-agent | 172.16.1.7 |
1. 添加监控主机
1.1 在zabbix-server上安装监控主机
#安装agent
[root@Zabbix-server ~]# yum install zabbix-agent.x86_64 -y
#设置开机启动
[root@Zabbix-server ~]# systemctl enable zabbix-agent
#启动agent
[root@Zabbix-server ~]# systemctl start zabbix-agent
#查看默认启动的端口
[root@Zabbix-server ~]# netstat -tunlp|grep 1005
tcp 0 0 0.0.0.0:10050 0.0.0.0:* LISTEN 9903/zabbix_agentd
tcp6 0 0 :::10050 :::* LISTEN 9903/zabbix_agentd
1.2 在其它服务器上安装监控主机
#下载rpm包
[root@agent ~]# wget https://mirrors.tuna.tsinghua.edu.cn/zabbix/zabbix/4.0/rhel/7/x86_64/zabbix-agent-4.0.20-1.el7.x86_64.rpm
#安装agent
[root@agent ~]# rpm -ivh zabbix-agent-4.0.20-1.el7.x86_64.rpm
#修改agent配置文件,将Server=127.0.0.1修改为172.16.1.71
[root@agent ~]# vim /etc/zabbix/zabbix_agentd.conf
#启动zabbix-agent
[root@agent ~]# systemctl enable zabbix-agent
[root@agent ~]# systemctl start zabbix-agent
1.3 web界面添加监控主机
通过在Web界面上配置来添加监控主机:
关联模板,没有模板就没有监控项,可以先使用默认的模板,监控常规项:
2. 添加Zabbix触发器
2.1 系统触发器
点击用户头像,打开用户基本资料,选择开启“正在发送消息”来开启此功能。如果有警告,系统会发出警告声:
查看系统自带的触发器:
测试“Linux用户密码文件发生改变” 触发器:
首先设置采集的时间间隔,将原来默认1小时修改为10s:
查看最新数据,可以看到最新数据是:3356102413
在172.16.1.7监控主机上使密码文件发生变化:
[root@agent ~]# md5sum /etc/passwd
41a16f7241d08a7246b8999a0fab90c5 /etc/passwd
#得到的最新数据和Web界面上显示的一样
[root@agent ~]# cksum /etc/passwd
3356102413 1002 /etc/passwd
#添加新用户来改变/etc/passwd文件
[root@agent ~]# useradd thanlon
#再查看最新数据,这时候这个Web页面上最新数据应该发生改变为4061271438
[root@agent ~]# cksum /etc/passwd
4061271438 1041 /etc/passwd
进入图形,可以图形、值和最近500个值三种视图展示数据的改变:
数据发生改变后,系统会发出两声警报:
2.2 自定义触发器
下面创建一个“当前系统用户登录超过2个报警”的触发器。选择创建触发器:
添加触发器名称和表达式,选择“添加”即可:
在触发器页面可以看到设置的触发器:
默认的更新间隔是10min,测试的时候,可以改为10s:
下面再创建2个登录终端,可以通过 w 命令查看当前登录的终端:
[root@agent ~]# w
12:10:21 up 53 min, 3 users, load average: 0.00, 0.03, 0.05
USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
root pts/0 10.0.0.7 11:19 3:49 0.28s 0.28s -bash
root pts/1 10.0.0.7 12:06 5.00s 0.02s 0.01s w
root pts/2 10.0.0.7 12:07 2:57 0.01s 0.01s -bash
root pts/1 10.0.0.7 12:06 5.00s 0.02s 0.01s w
此时当前的用户数为3,超过了我们自定的2,触发了我们自定义的当前系统用户数量登录数:
当我们关掉一个登录连接,可以发现登录数已经变成了2,系统响了一声在页面上发出提示,问题已解决
系统的触发器一般监控CPU、内存、硬盘、网络、进程 等常用的监控项。触发器之间还可以设置依赖关系,可以设置被依赖的触发器如果被触发了,依赖它的触发器可以不触发。
2.3 自动生成触发器
还不熟悉自己写表达式的时候,可以自定义生成触发器:
可以设置大于4个报警,小于3个恢复:
接下来就是改变当前系统(172.16.1.7)用户登录数,当设置为5个连接数时,系统报出现问题,当关闭两个连接设置为2个连接时,恢复:
3. 报警声音的更换
可以在zabbix server上找到报警声音的文件:
[root@Zabbix-server ~]# cd /usr/share/zabbix/audio/
[root@Zabbix-server audio]# ls
alarm_average.mp3 alarm_high.mp3 alarm_ok.mp3 no_sound.mp3
alarm_disaster.mp3 alarm_information.mp3 alarm_warning.mp3