运维面试故障整理

一、监控服务器宕机不报警。

1.原因:当监控服务器,突然宕掉时,在我对每台服务器都设置了内存,流量等报警阀值的情况下,zabbix并没有触发报警。

2.分析:zabbix使用的c/s模式,每台监控目标主机要安装agent,zabbix服务器采用轮询的方式从监控目标机的agent获取数据,如果目标主机down了。目标机的agent ,通常也无法工作zabbix有个机制,对于自定义项,如果采集不到agent的值,就保留最后一次获得的值。正因为采信值一直是使用down机前的数据,不会更新,直到再次成功采集到目标机的值。

3.解决问题:zabbix提供了一个“简单检查” 功能,该功能独立于agent作业,即使目标主机down机了,依然可以检测。

方法:(1)一种使用ping命令,安装fping软件,增加fping模块。

(2)监控目标机的开放端口,测试其端口是否打开来判断主机是否存活。

二、MYSQL主机延迟处理方案。

1.原因:首先我们要知道产生主从延迟的原因是什么?一般做数据库的读写分离的时候都由于数据库扛不住用户的大量请求,导致数据库出现瓶颈,为增大数据库的吞吐量而做的。那么一个请求往主库里面写的时候,同时会同步一份数据写到从库中,如果此时从库处于非常繁忙的状态,就全出现主库的数据没法及时同步到从库,从库无法查询到新增的数据,就产生了主从延迟。

2解决办法:治标

(1)采用并行复制

(2)优化数据库配置

(3)在增加从库个数

治本:

(1)采用完全同步方式(不推荐)

(2)引入redis缓存,先写入到redis,有就直接读,没有就找mysql。

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值