这篇文章将介绍当WEB服务器报警,提示磁盘使用率问题和带宽满载时的一些排查思路和解决方案。
首先,我们一定要配置服务器的云监控,如果是云厂商的服务器都有监控服务,开通即可。
如果是自建机房,监控报警策略也是必须搭建的。
磁盘使用率报警
原因分析
- 日志没有及时迁移或清理
- 程序异常输出了大量的垃圾文件
- 挂载的硬盘存储空间不足,不适应业务发展,需要挂载新的磁盘。
解决方案
1. 日志迁移或清理
我们需要Nginx日志和项目运行中的关键日志,方便定位问题、数据分析。
日志迁移的思路很简单,目前主流的云厂商都支持日志迁移和存储服务,且成本不高。
如果是自建的服务,可以挂载专门的存储硬盘,不和业务服务器耦合在一起,将日志进行单独存储。
2. 日志清理
- 切换到根目录
cd /
复制代码
- 查找到大文件,比如找到大于100M的文件
find . size +100M
复制代码
- 没用的日志大文件置为空(不要直接删除,正在被使用的文件是无法直接删除的)
cat /dev/null > /data/logs/php-fpm/error.log
复制代码
网站流量异常,一直在报警
当网站流量报警时喜忧参半,如果是因为搞活动或者网站内容命中了热点,被搜索引擎推荐,那真是像买彩票中奖一样高兴。
不过,大多数情况,网站在毫无预兆的情况