应用服务器集群的伸缩性设计

前言

应用服务器应该设计成无状态的,也就是说应用服务器不存储请求上下文信息,如果将部署有相同的应用服务器组成一个集群,每次用户的请求都可以发送到集群中任意一台服务器上去处理,任何一台服务器的处理结果都是相同的。这样只要能将用户请求按照某种规则分发到集群中的不同服务器上,就可以构成一个服务器集群了,每个用户的请求都可能落在不同服务器上。

负载均衡服务器:它是个HTTP请求分发装置,可以感知或者可以配置集群的服务器数量,可以及时发现集群中新上线或者下线的服务器,并能向新上线的服务器分发请求,停止向已下线的服务器分发请求,这样负载均衡服务器就实现了应用服务器集群的伸缩性了。
这里写图片描述

下面是实现负载均衡的基本技术

HTTP重定向负载均衡

利用HTTP重定向协议实现负载均衡。如下图
这里写图片描述

HTTP重定向负载均衡服务器的唯一功能就是根据用户的HTTP请求计算一台真实的Web服务器地址,并将该Web服务器地址写入到HTTP重定向响应中(响应状态码302)返回给用户浏览器。

优点:比较简单
缺点:浏览器需要请求两次服务器才能完成一次访问,性能比较差,重定向服务器自身的处理能力有可能成为瓶颈,使用HTTP302响应码重定向,有可能使搜索引擎判断为SEO作弊,降低搜索排名。
结论:实践中使用这个方案进行负载均衡的案例很少。

DNS域名解析负载均衡

这是利用DNS处理域名解析请求的同时进行负载均衡处理的方案,如下图
这里写图片描述

在DNS服务器中配置了多个A记录,如:
www.mysite.com IN A 114.100.80.1
www.mysite.com IN A 114.100.80.2
www.mysite.com IN A 114.100.80.3
每次域名解析请求都会根据负载均衡算法计算一个不同的IP地址返回,这样A记录中配置多个服务器就构成一个集群,并可以实现负载均衡。

优点:将负载均衡的工作交给了DNS,省掉了网站管理维护负载均衡服务器的麻烦,同时许多DNS还支持基于地理位置的域名解析,即会将域名解析成距离用户地理最近的一个服务器地址,这样就可以加快用户访问速度,改善性能。
缺点:目前的DNS是多级解析,每一级DNS都可能缓存A记录,但下线某台服务器时,即使修改了DNS的A记录,要使其生效也需要较长时间,这段时间,DNS依然会将域名解析到已经下线的服务器,导致用户访问失败,而且DNS负载均衡的控制权在域名服务商那里,网站无法对其做更多的改善和针对于自己网站的一些修改。
结论:大型网站总是部分使用DNS域名解析,利用域名解析作为第一级负载均衡手段,即域名解析得到的一组服务器并不是实际提供Web服务的物理服务器,而是同样提供负载均衡服务的内部服务器,这组内部负载均衡服务器再进行负载均衡,再将请求分发到真实的Web服务器上。

反向代理负载均衡

利用反向代理进行负载均衡,如下图:
这里写图片描述

利用反向代理缓存资源,可以改善网站性能。实际上,在部署位置上,反向代理服务器处于Web服务器前面(这样才可能缓存Web响应,加速访问),这个位置也正好是负载均衡服务器所在的位置,所以大多数的反向代理服务器提供了负载均衡的功能,管理一组Web服务器。Web服务器处理完的响应也需要通过反向代理服务器返回给用户。由于Web服务器不直接对外提供访问,因此Web服务器不需要使用外部IP地址,而方向代理服务器则需要配置双网卡和内部外部两套IP地址。

优点:由于反向代理服务器转发请求在HTTP协议层面,因此也叫应用层负载均衡,其优点是和反向代理服务器功能集成在一起,部署简单。
缺点:反向代理服务器是所有请求和响应的中转站,其性能可能会成为瓶颈

IP负载均衡

在网络层通过修改请求目的地址进行负载均衡,如下图
这里写图片描述

用户请求数据包到达负载均衡服务器114.100.80.10后,负载均衡服务器在操作系统内核进程获取网络数据包,根据负载均衡算法计算得到一台真实Web服务器10.0.0.1,然后将数据目的IP修改为10.0.0.1,不需要通过用户进程处理。真实的Web服务器处理完成后,响应数据包回到负载均衡服务器,负载均衡服务器再将数据包源地址修改为自身的IP地址(114.100.80.10)发送给用户浏览器。
这里关键在于真实物理Web服务器响应数据包如何返回给负载均衡服务器。一种方案是负载均衡服务器在修改目的IP地址的同时修改源地址,将数据包源地址设为自身IP,即源地址转换(SNAT),这样Web服务器的响应会再回到负载均衡服务器;另一种方案就是将负载均衡服务器同时作为真实物理服务器集群的网关服务器,这样所有响应数据都会到达负载均衡服务器。

优点:IP负载均衡在内核进程完成数据分发,较反向代理负载均衡(在应用程序中分发数据)有更好的处理性能。
缺点:所有请求响应都需要经过负载均衡服务器,集群的最大响应数据吞吐量不得不受制于负载均衡服务器网卡带宽,对于提供下载服务或者视频服务等需要传输大量数据的网站而言,难以满足需求。

数据链路层负载均衡

数据链路层负载均衡能过实现IP负载均衡中让负载均衡服务器只分发请求,而使响应数据从真实物理服务器直接返回给用户的需求。数据链路层负载均衡是指在通信协议的数据链路层修改mac地址进行负载均衡。如下图
这里写图片描述

这种数据传输方式又称作三角传输模式。负载均衡数据分发过程中不修改IP地址,只修改mac地址,通过配置真实物理服务器集群所有机器虚拟IP和负载均衡服务器IP地址一致,从而达到不修改数据包的源地址和目的地址就可以进行数据分发的目的,由于实际处理请求的真是物理服务器IP和数据请求目IP一致,不需要通过或负载均衡服务器进行地址转换,可将响应数据直接返回给用户浏览器,避免了负载均衡服务器网卡带宽成为瓶颈。这种负载均衡方式又称为直接路由方式(DR)

结论:使用三角传输模式的链路层负载均衡是目前大型网站使用最广的一种负载均衡手手段,在Linux平台上最好的链路层负载均衡开源产品是LVS(Linux Virtual Server)。

负载均衡算法

负载均衡的实现可以分为2个部分:
1. 根据负载均衡算法和Web服务器列表计算得到集群中一台Web服务器的地址
2. 将请求数据发送到该地址对应的Web服务器上

具体的负载均衡算法通常有下面几种:
轮询(Round Robin, RR)
所有请求被依次分发到每台应用服务器上,即每台服务器需要处理的请求数目都相同,适合所有服务器硬件都相同的情况。
加权轮询(Weighted Round Robin, WRR)
根据应用服务器硬件性能的情况,在轮询的基础上,按照配置的权重将请求分发到每个服务器,高性能的服务器能分配更多的请求
随机(Random)
请求被随机分配到各个应用服务器,在许多场合下,这种方案都很简单实用,因为好的随机数本身就很均衡。即使应用服务器硬件配置不同,也可以使用加权随机算法
最少连接(Least Connections)
记录每个应用服务器正在处理的连接数(请求数),将新得到的请求分发到最少连接的服务器上,应该说,这是最符合负载均衡定义的算法。同样,最少连接算法也可以实现加权最少连接。
源地址散列(Source Hashing)
根据请求来源的IP地址进行Hash计算,得到应用服务器,这样来自同一个IP地址的请求总在同一个服务器上处理,该请求的上下文信息可以存储在这台服务器上,在一个会话周期内重复使用,从而实现会话粘滞。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值