1. 背景
nginx 反向代理一个网址,访问时约有四分之一的概率成功,查看 nginx 的 error.log 发现大量如题的错误信息。
2. 排查
利用命令查看 nginx 链接数:
netstat -nat|grep -i "80"|wc -l
结果显示 nginx 的 80 端口,只有22个链接数,
worker_connections 1024
很明显没有达到瓶颈。
后来解析了反向代理的域名,发现对解析出的5个IP,只有其中1个的访问权限。与系统服务商沟通后了解到,他们的系统在受到 ddos 攻击后,会自动改变域名对应的 IP,最近正好换了一次 IP。
由于公司的网络安全策略,只能针对 IP 申请访问权限。这也解释了为什么有小概率成功的现象。
nginx 代理上之所以会出现这个情况,是因为今天重启了 nginx(杀死线程,再次启动),导致加载的这个域名解析缓存被清除(先前申请过解析出的 IP 访问权限),启动后再次访问解析出的新 IP(大部分)没有权限。
所以解决方法也很简单,开通新 IP 的访问权限即可。
如果是个人玩,把防火墙关了也行。
附带:iP或域名查询