当访问一个域名例如www.baidu.com
时候,浏览器首先查询DNS服务器获取对应IP,然后通过IP访问对应服务。
一个很简单问题,当某台服务器重启或者故障,DNS有一定缓存事件,故障后切换时间长。
外网DNS应该用GSLB(全局负载均衡)进行流量调度,将请求分配到最近服务器以提升体验。而当某一区域机房出现问题,可以通过DNS指向其他区域机房。
对于内网DNS,使用一般轮询就可以了。
对于一般应用,使用Nginx就可以了。LVS(软件负载均衡器)和F5(硬负载均衡器)
- 二层负载均衡是通过改写报文的目标MAC地址为上游服务器MAC地址,源IP地址和目标IP地址是没有变的,负载均衡服务器和真实服务器共享一个VIP,如LVS DR工作模式。
- 四层负载均衡是根据端口将报文转发到上游服务器(不同IP地址+端口),入LVS NAT模式、HaProxy,七层负载均衡是根据端口号和应用协议入HTTP协议主机名、URL,转发报文到上游服务器(不同IP地址+端口),入HaProxy、Nginx
负载均衡主要关心以下几个方面
- 上游服务器配置:使用upstream server 配置上游服务器
- 负载均衡算法:配置多个上游服务器时负载均衡机制
- 失败重试机制:配置当超时或者上游服务器不存活时,是否需要重试其他上游服务器
- 服务器心跳检查:上游服务器健康/心跳检查
以下配置步骤指Nginx中配置:
upstream配置
- IP地址和端口
- 权重,权重越大,分配请求越多。
负载均衡算法
默认采取轮询即round-robin。
同时支持以下几种:
- round-robin:轮询,配合权重(weight)可以实现基于权重轮询
- ip_hash:根据客户IP进行负载,即相同ip负载均衡到同一upstream
- hash key [consistent]:对某一个key进行哈希或者使用一致性哈希进行负载均衡。使用Hash算法存在问题,当添加或者删除一台服务器时,将导致很多key被重新负载均衡到不同服务器(从而导致后端可能出现问题);因此建议使用一致性哈希算法,有consisten_key动态指定,这样当删除/添加一台服务器时,只有少数key将被重新负载均衡到不同服务器。
哈希算法:使用uri进行hash。一致性哈希算法,传入consisten_key动态执行定 - least_conn:将请求负载均衡到最少活跃连接的上游服务器。如果配置服务器较少,则将转使用基于权重轮询。
失败重试
主要有两部分配置:upstream server和 proxy_pass。
同步上游服务器的max_fails 和fail_timeout,来指定每个上游服务器,当fail_timeout时间内失败了max_fails次请求,则认为该上游服务器不可用,然后摘掉该上游服务器,fail_timeout时间后会再次将该服务器加入到存活上游服务器列表进行重试。
健康检查
Nginx对上游服务器的健康检查采用默认的惰性策略。
- TCP心跳检查
- HTTP心跳检查
其他配置
对上游服务器的一些配置
- 域名上游服务器,当某一台服务器IP变化,Nginx解析配置文件阶段会将IP地址记录,但是当ip变化是Nginx不会动态更新,需要使用
set $backend "http://c0.3.cn"
- 备份上游服务器
- 不可用上游服务器,即把一个服务器置为不可用
长连接
配置Nginx与上游服务器的长连接。
只建议对小报文进行长连接
HTTP动态负载均衡
使用负载均衡实现中,每次upstream列表有变更,都需要到服务器修改。需要一种服务注册,可以将upstream 动态注册到Nginx上,从而实现upstream服务自动发现。
Consul是一款开源的分布式服务注册与发现系统,通过HTTP API可以使得服务注册、发现实现起来非常简单。
步骤:
- upstream服务启动,我们通过管理后台向consul注册服务。
- 我们需要Nginx机器上部署并启动Consul-template Agent,其通过长轮询监听服务变更
- Consul-template监听到变更后,动态修改upstream列表
- Consul-template修改完upstream列表后,调用重启Nginx脚本重启Nginx。
使用Consul注册服务,使用OpenResty balancer_by_lua实现无reload动态负载均衡。即会实时更新到共享字典。
- 通过upstream server 启动/停止时注册服务,或者通过Consul管理后台注册服务
- Nginx启动时会调用init_by_lua,启动时拉去配置,并更新到共享字典来存储upstream列表;然后通过init_worker_by_lua启动定时器,定期去COnsul拉去配置并实时更新到共享字典
- balancer_by_lua使用共享字典存储upstream列表进行动态负载均衡。
Nginx四层负载均衡
Nginx1.9.0起支持四层负载均衡。
- 四层就是基于IP+端口的负载均衡;四层通过虚拟IP+端口接收请求,然后再分配到真实的服务器;
- 七层就是基于URL等应用层信息的负载均衡;七层通过虚拟的URL或主机名接收请求,然后再分配到真实的服务器。
- 同理,还有基于MAC地址的二层负载均衡和基于IP地址的三层负载均衡。 换句换说,二层负载均衡会通过一个虚拟MAC地址接收请求,然后再分配到真实的MAC地址;
- 三层负载均衡会通过一个虚拟IP地址接收请求,然后再分配到真实的IP地址;
参考资料:
- 亿级流量网站架构核心技术
- https://kb.cnblogs.com/page/188170/