nginx.pid文件丢失,日志无法正常轮转。解决方法:
故障原因,日志被迁移后,kill-USR1 pid 没有成功,致使nginx写的文件句柄还是在旧的文件里。

模拟故障:
1: 我们 mv 日志文件为.bak
2: 我们清空nginx.pid文件
3: 我们试图reload的时候失败,因为pid文件是空的。这时候我们使用killall nginx ,然后再启动nginx才能解决。

[root@node3090 nginx]# ps -ef |grep nginx

root     10287    1  0 10:18 ?        00:00:00 nginx: master process/usr/sbin/nginx -c /etc/nginx/nginx.conf

nobody   10290 10287 0 10:18 ?        00:00:00 nginx:worker process                  

nobody   10291 10287 0 10:18 ?        00:00:00 nginx:worker process                   

nobody   10292 10287 0 10:18 ?        00:00:00 nginx:worker process                  

nobody   10295 10287 0 10:18 ?        00:00:00 nginx:worker process                  

nobody   10296 10287 0 10:18 ?        00:00:00 nginx:worker process                   

nobody   10297 10287 0 10:18 ?        00:00:00 nginx:worker process                  

nobody   10298 10287 0 10:18 ?        00:00:00 nginx:worker process                  

nobody   10299 10287 0 10:18 ?        00:00:00 nginx:worker process                  

nobody   10300 10287 0 10:18 ?        00:00:00 nginx:worker process                  

nobody   10301 10287 0 10:18 ?        00:00:00 nginx:worker process                  

nobody   10304 10287 0 10:18 ?        00:00:00 nginx:worker process                  

nobody   10306 10287 0 10:18 ?        00:00:00 nginx:worker process                  

nobody   10307 10287 0 10:18 ?        00:00:00 nginx:worker process                   

nobody   10308 10287 0 10:18 ?        00:00:00 nginx:worker process                  

nobody   10310 10287 0 10:18 ?        00:00:00 nginx:worker process                  

nobody   10311 10287 0 10:18 ?        00:00:00 nginx:worker process                  

root     10713 10080  0 10:24 pts/0    00:00:00 grep --color=auto nginx

[root@node3090 nginx]# less/var/run/nginx.pid

10287

[root@node3090 nginx]# pwd

/etc/nginx

[root@node3090 nginx]# mv/data/logs/access.log /data/logs/access.log.bak

[root@node3090 nginx]# cd/data/logs/

[root@node3090 logs]# ls

access.log.bak  error.log nginx_access.log nginx_error.log  nginxlog.sh

[root@node3090 logs]# echo "" > /var/run/nginx.pid

[root@node3090 logs]#/etc/init.d/nginx reload

Reloading nginx:                                          [FAILED]

 

平滑解决方法:
1:平滑生成日志,不需要重启。我们发现access.log已经存在。

2:但pid文件还是空的,所以nginx reload是失败的。
3:我们将pid号覆盖掉/var/run/nginx.pid
4:nginx reload 成功,此过程不涉及到任何重启nginx情况,实现0请求丢失。

 

[root@node3090 logs]# ps -ef |grep nginx | grep root | grep -v grep | awk '{print $2}'|xargs -i kill -USR1{}   

[root@node3090 logs]# ls

access.log  access.log.bak  error.log nginx_access.log  nginx_error.log  nginxlog.sh

[root@node3090 logs]#/etc/init.d/nginx reload

Reloading nginx:                                          [FAILED]

[root@node3090 logs]# ps -ef |grep nginx | grep root | grep -v grep | awk '{print $2}' |xargs -i echo {} >/var/run/nginx.pid

[root@node3090 logs]#/etc/init.d/nginx reload

Reloading nginx:                                          [  OK  ]

解决方法对比:

第一种方法,即killallnginx方法解决,然后启动。

1:如果只有单台nginx,会有请求丢失的情况。

2:因为是硬重启,无法启动的可能性。

第二种方法,平滑重启不会丢失任何清理,且不存在任何危险,可以放入脚本中执行。