什么是监控,为啥要用到监控?
1.监控就是监视,控制
2.实际生产环境中是有很多台服务器的,每个服务器的提供的服务都不一样,当然这么多服务器,我们也不能时时刻刻是命令检查服务器状态是否正常,所以我们就需要用到监控软件-那就是zabbix
3.随着用户的增多,服务·随时可能被系统oom out of memory
也就是说当内存不够的时候,linux 系统就会杀掉一些进程,让内核可以继续运行,也就是linux系统稳定的原因。所以当我们上线新网站的时候就可以先给他进行压力测试。
![9469008-1be8779752e2b40a.png](https://i-blog.csdnimg.cn/blog_migrate/e3eeeb9584a410d4eb4e78ee261d0800.png)
zabbix被监控端配置
![9469008-237101c79626fa21.png](https://i-blog.csdnimg.cn/blog_migrate/8abac7f832139b7ad6afc371277db88c.png)
因为没有安装被监控端所有会有报错
1.安装agent
[root@zabbix /etc/zabbix]# rpm -ivh https://mirrors.tuna.tsinghua.edu.cn/zabbix/zabbix/4.0/rhel/7/x86_64/zabbix-agent-4.0.9-3.el7.x86_64.rpm
Retrieving https://mirrors.tuna.tsinghua.edu.cn/zabbix/zabbix/4.0/rhel/7/x86_64/zabbix-agent-4.0.9-3.el7.x86_64.rpm
Preparing... ################################# [100%]
Updating / installing...
1:zabbix-agent-4.0.9-3.el7 ################################# [100%]
这里使用的是清华源
2.修改配置文件
[root@zabbix /etc/zabbix]# grep '^Server' /etc/zabbix/zabbix_agentd.conf
Server=127.0.0.1
ServerActive=127.0.0.1
因为我是在zabbix服务端也装了一个被监控端,监控端和被监控端在一台机器上所有这里可以写127.0.0.1
3.启动并设置开机自启
[root@zabbix /etc/zabbix]# systemctl start zabbix-agent.service
[root@zabbix /etc/zabbix]# systemctl enable zabbix-agent.service
4.浏览器检查
![9469008-7b436ddc52829b82.png](https://i-blog.csdnimg.cn/blog_migrate/fa980e6eb71595cbb3da55979974f5ab.png)
模拟添加一台被监控端
操作同上面一样,只需要把配置文件改为zabbix-server的地址即可
1.修改配置文件
[root@zabbix /etc/zabbix]# grep '^Server' /etc/zabbix/zabbix_agentd.conf
Server=10.0.0.81
ServerActive=127.0.0.1
2.创建一台主机
![9469008-a2b17861c50c476c.png](https://i-blog.csdnimg.cn/blog_migrate/e890dd2cd6c45860068559bf8c6ee32c.png)
![9469008-47ff8e1e4f430752.png](https://i-blog.csdnimg.cn/blog_migrate/b0d3ee8866c9ba76681ed6b1dea9bcdd.png)
凡是带*号的为必填项。ip地址填写被监控端的地址,必须要和备监控端的在一个网段
3.链接一个模板
模板可以使用默认的,搜索Template OS Linux就能查到
![9469008-8bc22f3264e46ddd.png](https://i-blog.csdnimg.cn/blog_migrate/22069423d44d7e0dc3425d7eef49ae40.png)
4.重启zabbix-server的服务
[root@zabbix ~]# systemctl restart zabbix-server.service
这是因为web上面设置的10m分钟才会从新读取一下数据,之间重启服务可以加快他的读取
5.浏览器检查
![9469008-5cbfe899c8f3d57d.png](https://i-blog.csdnimg.cn/blog_migrate/8182cc93b4e93f3fc475a51f43c54df3.png)
添加自定义监控项
1.查看已经存在的监控项
![9469008-c479967a00568cb6.png](https://i-blog.csdnimg.cn/blog_migrate/515a3ff669237b7ca77d1e80c1fe2faa.png)
![9469008-0bbb317935d57354.png](https://i-blog.csdnimg.cn/blog_migrate/a27c7bb7547312215461f432ccfc4bc3.png)
![9469008-ec7472cca3de1fc3.png](https://i-blog.csdnimg.cn/blog_migrate/5516282ad953c85e50e1e95c2400997c.png)
这里就是zabbix自带的一些监控项,图中圈起来的就是一些键值(key).键值就是zabbix用于监控的类式余脚本的东西。我们可以尝试取下键的值。
2.安装zabbix-get 。
yum install -y zabbix-get
![9469008-c149977c13adbe53.png](https://i-blog.csdnimg.cn/blog_migrate/967ce3badaded663d2d8a0b59b0a913f.png)
3.尝试取值
[root@zabbix-server /etc/zabbix/zabbix_agentd.d]# zabbix_get -s 127.0.0.1 -p 10050 -k system.hostname
zabbix-server
安装之后命令是zabbix_get ,参数-s 为要取值的ip -p 为端口 -k为要取的值
这些值都是zabbix-agent来取的。
4.取出用户连接数
[root@m01 ~]# who
root pts/0 2019-07-09 22:09 (10.0.0.1)
root pts/6 2019-07-09 14:44 (10.0.0.1)
[root@m01 ~]# who|wc -l
2
5.设置自定义key
格式为:UserParameter=<key>,<shell command> 。因为zabbix-agend 是用来取值的,所以把自定义key放到它的配置文件里
[root@m01 ~]# grep '^User' /etc/zabbix/zabbix_agentd.conf
UserParameter=tps,iostat|awk '/^sda/{print $2}'
UserParameter=ssh_user,who|wc -l
[root@ m01/etc/zabbix]# systemctl restart zabbix-agent.service
修改了配置文件记得重启
6.zabbix-get测试取值。
[root@zabbix-server ~]# zabbix_get -s 10.0.0.61 -k ssh_user
2
命令行测试没问题,去web界面添加自定义监控
7.添加自定义监控
zabbix自带的监控项满足不了我们需求
![9469008-812e4cb9ec6d9782.png](https://i-blog.csdnimg.cn/blog_migrate/0f3f1a52b964ac8207bf5c7ae1a843f6.png)
![9469008-38c9e1aa5d0fe34e.png](https://i-blog.csdnimg.cn/blog_migrate/20b769712f838e9452bb53c4942458ad.png)
![9469008-03b431f2c7256882.png](https://i-blog.csdnimg.cn/blog_migrate/43f71490a864db905161a97d4845e563.png)
7.添加自定义触发器
![9469008-386adee7f88cdd25.png](https://i-blog.csdnimg.cn/blog_migrate/c8dc93b6cf71174e0b3403789514a902.png)
![9469008-421b5b8f6207114c.png](https://i-blog.csdnimg.cn/blog_migrate/15590f4437f694ee450d65937a91b352.png)
![9469008-989a00d64e9c61e9.png](https://i-blog.csdnimg.cn/blog_migrate/2559f440c3cba4931309e7ab26808e18.png)
![9469008-b21fb1c48646b252.png](https://i-blog.csdnimg.cn/blog_migrate/0c6792e38001cd255e19cab51c5c546f.png)
![9469008-37d8f9cf3698c1c7.png](https://i-blog.csdnimg.cn/blog_migrate/25e5b0b885609135a1bb2a9e5a276235.png)
![9469008-5942725af9f668c2.png](https://i-blog.csdnimg.cn/blog_migrate/26a1b4c5a02e273cd9201a31edae8248.png)
8.触发监控
多开几个窗口
![9469008-997d9864d169d98b.png](https://i-blog.csdnimg.cn/blog_migrate/2936f17aaab255086c49f5603425816b.png)
[root@m01 ~]# who
root pts/0 2019-07-09 22:09 (10.0.0.1)
root pts/1 2019-07-09 22:33 (10.0.0.1)
root pts/2 2019-07-09 22:34 (10.0.0.1)
root pts/6 2019-07-09 14:44 (10.0.0.1)
[root@m01 ~]# who|wc -l
4
![9469008-c35ac0a80f450557.png](https://i-blog.csdnimg.cn/blog_migrate/e07cd5c9a7c78fe879d3bcd72dd726aa.png)
自定义触发器的时候选择的大于4个就报警。