目录
1.HTTP重定向负载均衡
根据用户的HTTP请求计算一台真实的Web服务器地址,并将改Web服务器地址写入HTTP重定向响应中(响应状态码302)返回给用户浏览,浏览器得到ip真实地址再重新请求实际物理服务器ip地址,完成访问。
优点:设计简单
缺点:浏览器需要两次请求服务器才能完成一次访问,性能较差;
重定向服务器自身的处理能力有可能成为瓶颈,集群伸缩性规模有限,
使用HTTP302响应码重定向,有可能使搜索引擎判断SEO作弊,降低搜索排名。
2.DNS域名解析负载均衡
在DNS服务器中配置多个ip记录,如:www.site1.com、www.site2.com、www.site3.com、www.site4.com,每次域名解析请求都会根据负载算法得到不同的ip地址返回。
优点:负载均衡的工作转给DNS减少网站维护麻烦,同时DNS支持地域位置域名解析可以加快访问速度。
缺点:由于DNS是多级解析,修改DNS记录生效时间长可能导致访问线下下线的服务器访问失败,
控制权在域名商哪里,
一般利用域名解析作为第一级负载均衡手段,解析后得到一组负载均衡服务器。
3.反向代理负载均衡
在部署上,反向代理处于web服务器前面,这样可以缓存web资源加速访问,将请求根据负载均衡算法转发到不同web服务器上,web服务器处理完成的响应也需要通过反向代理服务器返回给用户,由于web服务器不直接对外提供访问,因此web不需要外部ip地址,而反向代理服务器需要配置双网卡和内部外部两套ip地址。由于反向代理转发请求在http协议层面,因此也叫应用层负载均衡。
优点:部署简单
缺点:反向代理服务器是所有请求和响应的中转站,自身性能可能会成为瓶颈
4.IP负载均衡
用户请求数据包到达负载均衡服务器114.100.80.10后,负载均衡服务器在操作系统内核进程获取网络数据包,根据负载算法得到一台真实web服务器10.0.0.1,然后将数据目的ip地址修改为(10.0.0.1),不需要通过用户进程处理。真实web服务器处理完成后,响应数据包回到负载均衡服务器,负载均衡服务器再将数据包源地址修改为自身的ip地址(114.100.80.10)发送给用户浏览器。
真实物理web服务器响应数据包如何返回给负载均衡服务器?
第一种方案:负载均衡服务器在修改目的ip地址的同时修改源地址,将数据包源地址设为自身ip,既源地址转换(SNAT),这样web服务器响应会再回到负债均衡服务器上。
另一种方案:将负载均衡服务器同时作为真实物理服务器集群的网关服务器,这样所有响应数据都会到达到负载均衡服务器上。
优点:ip负债均衡在内核进程完成数据分发,比反向代理负债均衡更好的处理性能。
缺点:由于所有请求响应都需要经过负载均衡服务器,集群的最大响应数据吞吐量不得不受制于负载均衡服务器网卡带宽,对提供下载服务、视频服务、传输大量数据网站难以满足。
5.数据链路层负载均衡
由图可看出 三角传输模式,负载均衡数据分发过程中不修改ip地址,只修改目的mac地址,通过配置真实物理服务器集群所有机器虚拟ip和负载均衡服务器ip地址一致,从而达到不修改数据包的源地址和目的地址进行数据分发的目的,由于实际处理请求的物理服务器ip和数据请求目的ip一致,不需要通过负载均衡服务器进行地址转换,可将响应数据包直接返回给用户浏览器,避免负载均衡服务器网卡带宽瓶颈,这种负载方式称为直接路由方式(DR).
三角传输模式的链路层负载均衡是大型网站使用比较广的一种手段,在linux中开源产品LVS(Linux Virtual Server)。
6.负载均衡算法
6.1 轮询(round robin ,RR)
所有请求被依次分发到每台应用服务器上,请求数目都相同,适合所有服务器硬件都相同的场景
6.2 加权轮询(weighted round robin,WRR)
根据应用服务器硬件性能情况,在轮询基础上按照配置的权重将请求分发到每个服务器上,高性能分配多一点
6.3 随机 (random)
请求随机分配到各个应用服务器上,因为随机本身就很负载,高性能的服务器也可以使用加权随机算法
6.4 最少连接(least connections)
记录每个应用服务器正在处理的连接数(请求数),将新的请求分发到最少连接的服务器上,这才最符合负载均衡定义的算法,同样也可以加权最少连接
6.5 源地址散列(source hashing)
根据请求来源的ip地址进行hash计算,得到应用服务器,这样来自同一个ip地址的请求总在同一台服务器上面处理,改请求的上下文信息可以存储在这台服务器上,在一个会话周期内重复使用,从而实现会话黏滞