很多大型的网站中,ngixn常常作为反向代理sever负载上游web server结合高可用机制构建一个大型web集群,而要通过nginx构建这样的一个集群,必然少不来nginx一个很重要的模块:负载均衡模块(upstream),如下所示为nginx负载均衡配置项介绍。

1.1 upstream 块配置项说明

语法:upstream name {...}    //指定负载均含name(名称)

配置块:http

upstream块定义了一个上游服务器的集群,便于反向代理中的proxy_pass使用。例如:

upstream backend {  
         server backend1.example.com;  
         server backend2.example.com;  
         server backend3.example.com;  
}   
server {  
    location / {  
    proxy_pass  http://backend;  
  }  
}

1.2 server 块配置项说明

语法:server name [parameters];

配置块:upstream

server配置项指定了一台上游服务器的名字,这个名字可以是域名、IP地址端口、UNIX句柄等,在其后还可以跟下列参数:

weight=number:设置向这台上游服务器转发的权重,默认为1。

max_fails=number:该选项与fail_timeout配合使用,指在fail_timeout时间段内,如果向当前的上游服务器转 发失败次数超过number,则认为在当前的fail_timeout时间段内这台上游服务器不可用。max_fails默认为1,如果设置为0,则表示 不检查失败次数。

fail_timeout=time:fail_timeout表示该时间段内转发失败多少次后就认为上游服务器暂时不可用,用于优化反向代理功能。它与向上游服务器建立连接的超时时间、读取上游服务器的响应超时时间等完全无关。fail_timeout默认为10秒。

down:表示所在的上游服务器永久下线,只在使用ip_hash配置项时才有用。

backup:在使用ip_hash配置项时它是无效的。它表示所在的上游服务器只是备份服务器,只有在所有的非备份上游服务器都失效后,才会向所在的上游服务器转发请求。

例如

upstream  backend  {  
          server   backend1.example.com    weight=5;  
          server   127.0.0.1:8080          max_fails=3  fail_timeout=30s;  
          server   unix:/tmp/backend3;  
}

1.3 ip_hash 配置说明

语法:ip_hash;

配置块:upstream

在有些场景下,我们可能会希望来自某一个用户的请求始终落到固定的一台上游服务器中。例如,假设上游服务器会缓存一些信息,如果同一个用户的请求任 意地转发到集群中的任一台上游服务器中,那么每一台上游服务器都有可能会缓存同一份信息,这既会造成资源的浪费,也会难以有效地管理缓存信息。 ip_hash就是用以解决上述问题的,它首先根据客户端的IP地址计算出一个key,将key按照upstream集群里的上游服务器数量进行取模,然 后以取模后的结果把请求转发到相应的上游服务器中。这样就确保了同一个客户端的请求只会转发到指定的上游服务器中。

ip_hash与weight(权重)配置不可同时使用。如果upstream集群中有一台上游服务器暂时不可用,不能直接删除该配置,而是要down参数标识,确保转发策略的一贯性。例如:

upstream backend {  
         ip_hash;  
         server   backend1.example.com;  
         server   backend2.example.com;  
         server   backend3.example.com  down;  
         server   backend4.example.com;  
}

 

注:upstream 支持的负载均衡算法

Nginx的负载均衡模块目前支持4种调度算法,下面进行分别介绍,其中后两项属于第三方调度算法。  

  • 轮询(默认)。每个请求按时间顺序逐一分配到不同的后端服务器,如果后端某台服务器宕机,故障系统被自动剔除,使用户访问不受影响。Weight 指定轮询权值,Weight值越大,分配到的访问机率越高,主要用于后端每个服务器性能不均的情况下。

  • ip_hash。每个请求按访问IP的hash结果分配,这样来自同一个IP的访客固定访问一个后端服务器,有效解决了动态网页存在的session共享问题。

  • fair。 这是比上面两个更加智能的负载均衡算法。此种算法可以依据页面大小和加载时间长短智能地进行负载均衡,也就是根据后端服务器的响应时间来分配请求,响应时 间短的优先分配。Nginx本身是不支持fair的,如果需要使用这种调度算法,必须下载Nginx的upstream_fair模块。

  • url_hash。此方法按访问url的hash结果来分配请求,使每个url定向到同一个后端服务器,可以进一步提高后端缓存服务器的效率。Nginx本身是不支持url_hash的,如果需要使用这种调度算法,必须安装Nginx 的hash软件包。

1.4 记录日志时支持的变量项说明

如果需要将负载均衡时的一些信息记录到access_log日志中,那么在定义日志格式时可以使用负载均衡功能提供的变量,见表所示

变量名
含义

$upstream_addr

处理请求的上游地址信息
$upstream_cache_status表示是否命中缓存,取值范围:miss expired updating stale hit
$upstream_status上游服务器返回响应http中响应代码
$upstream_response_time上游服务响应时间,单位为毫秒
$upstream_http_$HEADERhttp中头部信息:如host信息$upstream_http_host

例如;

log_format timing '$remote_addr - $remote_user [$time_local]  $request '  
  'upstream_response_time $upstream_response_time '  
  'msec $msec request_time $request_time';  
     
log_format up_head '$remote_addr - $remote_user [$time_local]  $request '  
  'upstream_http_content_type $upstream_http_content_type';

到这里,关于nginx的负载均衡相关配置项说明就基本结束了,很多配置是结合起来的,不要硬套即可。