nginx反向代理时的超时时间设置

最新推荐文章于 2024-08-30 12:09:51 发布

weixin_37839711

最新推荐文章于 2024-08-30 12:09:51 发布

阅读量7.4w

点赞数

分类专栏： nginx

nginx 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

环境搭建如下：

1.宿主机是WIN7，安装了Nginx

2.有3个tomcat以及memcached安装在同一个虚拟机里。系统是CentOs。第三个tomcat作为后备机。

3.通过httpwatch来观察请求情况

实验观察的是登录页面。页面会显示当前的session以及机子信息，代码如下：

SessionID:<%=session.getId()%>
<br>
SessionIP:<%=request.getServerName()%>
<br>
SessionPort:<%=request.getServerPort()%>
<br>
<%
out.println("This is Timcat Server 1");
%>

效果如下：

或者

Nginx的配置里，设置如下：

upstream netitcast.com { #服务器集群名字
server 192.168.88.103:8080 weight=1 ; #tomcat1
server 192.168.88.103:8082 weight=1 ; #tomcat2
server 192.168.88.103:8084 backup ; #tomcat3
}

location / {
proxy_pass http://netitcast.com;
proxy_redirect default;
proxy_connect_timeout 10;
}

此配置意思是，每个从Nginx分发的请求，连接到后台（tomcat X）的连接如果超过10秒，则视为连接失败，Nginx会将此请求分发到另一台tomcat。在一段时期内（现在不知道有多长），后续的请求都不会再发送到tomcat X了。过了一段时期后再送请求，又有可能把请求发送到tomcat X。此时，只要超时一次，则在往后一段时间内不再往tomcatX分发。

现在，如果我把tomcat1关闭，httpwatch的观察情况如下：

获取页面的请求用了10.033秒时间。我的理解是，这个请求被分发到tomcat1，然而此机已经关闭了，所以等了10秒。10秒后Nginx还没收到响应，则将请求往另一台机分发（tomcat2），而另一台机只用了0.033秒的时间就响应了。而页面里的css文件和js文件都在这时间基础上往tomcat2发送请求获取。

如果我将Nginx的配置改成如下：

#服务器的集群
upstream netitcast.com { #服务器集群名字
#server 192.168.218.129:8080 weight=1 max_fails=2 fail_timeout=600s;
#server 192.168.218.131:8080 weight=1 max_fails=2 fail_timeout=600s;
server 192.168.88.103:8080 weight=2 max_fails=2; #tomcat1
server 192.168.88.103:8082 weight=2 max_fails=2; #tomcat2
server 192.168.88.103:8084 backup ; #tomcat3
}

location / {
proxy_pass http://netitcast.com;
proxy_redirect default;
proxy_connect_timeout 10;
}

重启Nginx，情况如下图：

此处的配置不同处是，在分发的机子后面多了max_fails=2的配置。请求主页面的时候用了11.037秒，即首先Nginx把请求分发给tomcat1,由于tomcat1已经关闭，所以Nginx等了10秒都没得到响应，于是把原请求分发到tomca2，tomcat2用了1.037秒就响应了。然后在此时间基础上，页面并发地向Nginx发请求获取静态资源，这时有4个js请求首次是发向tomcat1。

对此，我猜测是这样。Nginx是按10秒作为监测间隔。第一个10秒内，发向tomcat1有一个请求超时，所以此时tomcat1仍生效。到了第二个10秒内，有4个请求发往tomcat1，且都超时，因为超时次数大于2次，所以后续页面其他的静态资源全部没再往tomcat1分发。但过一段时间后，我如果刷新页面，依旧有请求会被分发到tomcat1去。

也就是说，过了一段时间后，Nginx会把tomcat1当作正常的服务器，往它发分请求。而从上次认为异常到下次重新视为正常状态这个时间段有多长，我现在不知道。

这样的优点是，tomcat1挂掉了，但后续修复好后，直接重启tomcat1就行了。但缺点也很明显，在未修复重启前，每隔一段时间都会有某些请求会往tomcat1发送，这样就总会有某些请求要等至少10秒。如果没有设置max_fails值，则每10秒内只有一个请求要等10秒，如果设置为2以上，则就会很多了。

如果我再修改下Nginx配置如下：

#服务器的集群
upstream netitcast.com { #服务器集群名字
server 192.168.88.103:8080 weight=2 max_fails=2 fail_timeout=20s; #tomcat1
server 192.168.88.103:8082 weight=2 max_fails=2 fail_timeout=20s; #tomcat2

server 192.168.88.103:8084 backup ; #tomcat3

}

这次配置多了fail_timeout属性。

重启Nginx后，首次刷页面，情况如下：