一.LVS产生的背景

随着网站业务的量的增长,每天的PV会成倍的增长,服务器的压力会越来越大。如何处理每天成倍增加的PV呢,这就需要负载均衡技术的出现。负载均衡技术,简单的来说,就是将以前一台服务器需要处理的事情,现在交给一组服务器来处理。采用负载均衡架构的网站,能够非常出色的完成大量并发服务的处理请求。

LVS就是负载均衡技术的代表,并在生产环境中得到了广泛的应用。LVS是Linux Virtual Server的简写,是一个虚拟的服务器集群系统。LVS是由章文嵩博士开发的一款自由软件。通过LVS可以实现一个高可用,高性能的服务器应用集群。采用LVS技术做负载均衡架构的网站,在生产环境下处理日均2000万PV是完全没有问题的。可见,LVS在处理大量并发的时候,还是非常稳定的。

二.LVS负载均衡架构

LVS负载均衡架构由三部分组成,负载均衡层,服务器层,数据存储层

wKiom1LVHuihwKckAAEsQihvnlA853.jpg

负载均衡层:位于整个集群系统的最前端,由一台或多台负载均衡器组成。负责将用户的请求按照相应的配置调度给后端的服务器进行处理,不为用户的请求提供服务。这和快递的分拣比较相似,只将快递分发给不同的区域,而不是直接交给终端用户。由LVS技术配置的负载均衡器,就属于负载均衡层。

服务器层:由多组应用服务器所构成。可以是WEB,MAIL,DNS等服务。负责处理由负载均衡器分发的用户请求。

数据存储层:为服务器层提供共享的数据存储区域。采用共享存储技术,不论用户访问的是哪台后端服务器,可以确保访问数据的一致性。

.LVS相关术语:

Director:负载均衡器,本身并不提供任何服务,只是将用户请求按照所定义的调度算法,转发给后端的RealServer

RealServer:向客户端提供服务的一组或多组服务器

CIP:客户端IP地址

VIP:与客户端交互的虚拟IP地址

DIP:负载均衡器的IP地址

RIP: RealServer的IP地址

四.LVS的三种模式

1.DR:DirectRouting,直接路由模式

2.NAT:NetAddress Translation,网络地址转换模式

3.TUN:IPTunneling,IP隧道模式

五.LVS的调度算法

轮叫调度(Round Robin Scheduling)算法就是以轮叫的方式依次将请求调度不同的服务器。该算法假设所有服务器处理性能均相同,不管服务器的当前连接数和响应速度,平等的对待每一台服务器。

加权轮叫调度(Weighted Round-RobinScheduling)算法在轮叫调度算法的基础上,根据每台服务器的性能差异,手工分配相应的权重,具有较高权重的服务器会处理更多的服务请求。

目标地址散列(Destination Hashing)算法根据请求的目标IP地址,作为散列键从静态分配的散列表中找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。

源地址散列(Source Hashing)算法根据请求的源IP地址,作为散列键从静态分配的散列表中找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。

最少链接(Least Connections)算法动态地将网络请求调度到已建立的链接最少的服务器上。如果服务器具有相近的系统性能,采用“最少链接”调度算法可以较好的实现负载均衡。

加权最少链接(Weighted Least Connections)算法在最少链接的基础上,根据每台服务器的性能差异,手工分配相应的权重,具有较高权重的服务器将承受大比例的活动链接负载

基于局部性的最少链接(Locality-Based Least Connections)算法是针对目标IP地址的负载均衡,该算法根据请求的目标IP地址找出该目标IP地址最近使用的服务器,若该服务器是可用的且未超载,将请求发送到该服务器;若服务器不存在,或者该服务器超载且有服务器处于一般的工作负载,则用最少链接的原则选出一个可用的服务器,将请求发送到该服务器。

带复制的基于局部性最少链接(Locality-Based Least Connections with Replication)算法也是针对目标IP地址的负载均衡。它与LBLC算法的不同之处是它要维护从一个目标IP地址到一组服务器的映射,而LBLC算法维护从一个目标IP地址到一台服务器的映射。该算法根据请求的目标IP地址找出该目标IP地址对应的服务器组,按最少链接原则从服务器组中选出一台服务器,若服务器没有超载,将请求发送到该服务器,若服务器超载,则按最少链接原则从这个集群中选出一台服务器,将该服务器加入到服务器组中,将请求发送该服务器。同时,当该服务器组有一段时间未修改,将最忙的服务器从服务器组中删除,已降低复制的程度。