LVS负载均衡详解(一)

1、cluster

1、cluster概念
集群,为解决某个特定问题将多台计算机组合起来形成单个系统
2、系统拓展方式
Scale UP:向上扩展,增强
Scale Out:向外扩展,增加设备,是调度分配问题
3、Linux cluster类型:
LB :Load Balance 负载均衡,是一种集群技术,它将特定的业务分担给多台网络设备,或多条链路,从而提高业务处理能力,保证了业务的高可靠性。LVS就是一种负载均衡集群技术。

HA :High Aviliablity 高可用,高可用集群就是当某一个节点或者服务器发生故障时,另一个节点能够自动且立即向外提供服务,即将有故障节点上的资源转移到另一个节点上去,这样另一个节点有了资源就可以向外提供服务。高可用集群是用于单个节点发生故障时,能够自动将资源,服务进行切换,这样可以保证服务一直在线。

2、lvs

1、lvs是什么:

lvs(Linux Virtual Server)linux虚拟服务器,这是一个由章文嵩博士发起的一个开源项目,官网是http://www.linuxvirtualserver.org 现在LVS已经是Linux内核标准的一部分。使用LVS可以达到的技术目标是:通过LVS达到的负载均衡技术和Linux操作系统实现一个高性能高可用的Linux服务器集群,他具有良好的可靠性,可扩展性和可操作性。从而以低廉的成本实现最优的性能。lvs的负载均衡能力已经接近硬件,但是硬件十分昂贵。

2、lvs的基本工作原理

VS(virtual server调度器)根据请求报文的目标IP和目标协议及端口将其调度转发至某WEB服务器RS(real server)根据调度算法来挑选RS

3、lvs中的常用术语

VS:Virtual Server 调度器
DS:Director Server 前端负载均衡节点
RS:Real Server 后端真实的工作服务器
VIP:虚拟IP向外部直接面向用户请求,作为用户请求的目标IP
DIP:Director Server IP 主要用于和内部主机通讯的IP地址(调度器连接内网的地址)
RIP:Real Server IP 后端服务器的IP地址(内网)
CIP:Client IP 访问客户端的IP地址

4、访问流程
CIO<–>VIP==DIP<–>RIP
5、lvs的工作过程
在这里插入图片描述


 1. 当用户向负载均衡调度器DS发起请求,调度器将请求发往内核空间。
 2. PREOUTING链首先会接收到用户请求,判断目标IP确定是本机IP,将数据包发往INPUT链
 3. IPVS是工作在INPUT链上的,当用户请求到达INPUT时,IPVS会将用户请求和自己已定义好的集群服务进行比对,如果用户请求的就是定义的集群服务,那么此时IPVS会强行修改数据包李的目标IP地址及端口,并将新的数据包发往POSTROUTING链
 4. POSTROUTING链接收数据包后发现目标IP地址刚好是自己的后端服务器,那么此时通过选路,将数据包最终发给后端的服务器。

6、lvs的组成

lvs由两部分程序组成,包括ipvs和ipvsadm
1、ipvs(ip virtual server):工作在内核空间,是真正生效实现调度的代码
2、ipvsadm:用户空间的命令行工具,负责为ipvs内核框架编写规则,用于管理集群服务及后端真实的服务器(RS)

3、LVS的三种工作模式

1、基于NAT的LVS模式负载均衡
NAT(Network Address Translation)即网络地址转换,其作用是通过数据报头的修改,使得位于企业内部的私有IP地址可以访问外网,以及外部用户可以访问位于公司内部的私有ip主机。LVS负载调度器可以使用两块网卡配置不同的IP地址,eth0设置为私钥IP与内部网络通过交换设备相互连接,eth1设备为外网IP与外部网络联通。

在这里插入图片描述
第一步,用户通过互联网dns服务器解析到公司负载均衡设备上面的外网地址,相对于真实服务器而言,LVS外网IP又称为VIP,用户通过访问VIP即可连接后端的真实服务器,而这一切对用户而言都是透明的,用户以为自己访问的就是真实服务器,但他并不知道自己访问的VIP仅仅是一个调度器,也不清楚后端的真实服务器到底在那里,有多少真实服务器。
第二步,用户将请求发送至124.126.147.168,此时LVS将根据预设的算法选择后端的一台真实服务器(192.168.0.1~192.168.0.3),将数据请求包转发给真实服务器,并且在转发之前LVS会修改数据包中的目标地址以及目标端口,目标地址与目标端口将被修改为选出的真实服务器IP地址以及相应的端口。
第三步,真实的服务器将相应数据包返回给LVS调度器,调度器在得到相应的数据包后会将原地址和原端口修改为VIP及调度器相应的端口。修改完成后,由调度器将相应数据包发送回终端用户,另外,由于LVS调度器后一个连接Hash表,该表中会记录连接请求及转发信息,当同一个连接的下一个数据包发送给调度器时,从该Hash表中可以直接找到之前的连接记录,并根据记录信息选出相同的真实服务器及端口信息

NAT模型的特性

RS的网关必须指向DIP
DIP和RIP必须在同一个网段内
请求和响应报文都需要经过Director Server高负载场景中,Director Server易成为性能瓶颈
RS可以使用任意操作系统
缺陷,对Director Server压力会比较大,请求和响应都需经过director server

2、基于DR的LVS负载均衡(直接路由模式)
DR模式也叫直接路由模式,该模式中LVS依然仅承担数据的入站请求以及根据算法选出合理的真实服务器,最终由后端真实服务器负责将响应数据包发送返回给客户端
直接路由模式(DR模式)要求调度器与后端服务器必须在同一个局域网内,VIP地址需要在调度器与后端所有服务器之间共享,因为最终的真实服务器给客户端回应数据包时需要设置IP为VIP地址,目标IP为客户端,这样客户访问的是调度器的VIP地址,回应的原地址也依然是该VIP地址,客户端感觉不到后端服务器存在的。
由于多台计算机都设置了同样的一个VIP地址,所以在直接路由模式中要求调度器的VIP地址是对外可见的,客户端需要将请求数据包发送到调度器主机,真实服务器的vip对外是不可见的,但真实服务器却可以接受目标地址VIP的网络请求,并在回应数据包时将原地址设置为该VIP地址。
调度算法根据算法在选出真实服务器后,在不修改数据报文的情况下,将数据帧的MAC地址修改为选出的真实服务器的MAC地址,通过交换机将该数据帧发给真实服务器。
在这里插入图片描述
同一个局域网工作用mac地址寻址,mac地址寻址在数据链路层
具体工作过程
在这里插入图片描述
(1)当用户请求到达Director Server此时请求的数据报文会先到内核空间的PREROUTING 链,此时报文的源IP为CIP,目标IP 为VIP
(2)PREROUTIN检查发现数据包的目标IP是本机,将数据包送至INPUT链
(3)IPVS比对数据包请求的服务是否为集群服务,若是,将请求报文中的源MAC地址修改为DIP的MAC地址,将目标MAC地址修改为RIP的MAC地址,然后将数据包发送至POSTROUTING链,此时的源IP和目的IP均未修改,仅修改了源MAC地址为DIP的MAC地址,目标MAC地址为RIP的mac地址
(4)由于DS和RS在同一个网络中,所以是通过二层来传输。POSTROUTING 链检查目标MAC地址为RIP的MAC地址,那么此时数据包将会发至RealServer
(5)RS发送请求报文的MAC地址是自己的MAC地址,就接收报文,处理完成后,将响应报文通过lo接口传送给eth0网卡然后向外发出,此时的源IP地址为VIP,目标IP为CIP
(6)响应报文最终送达至客户端

DR模式的特性
保证前端路由将目标地址为VIP报文统统发给Director Server而不是RS,RS跟Director Server必须在同一个物理网络中,所有的请求报文经由Director Server,但响应报文必须不能经过DirectorServer
不支持地址转换,也不支持端口映射
RS可以使大多数常见的操作系统
RS的网关绝不允许指向DIP(因为我们不允许他经过director)RS上的lo接口配置VIP的IP地址
缺陷:RS和DS必须在同一个机房中
3、基于TUN的LVS负载均衡(ip隧道模式)
在LVS(nat)模式的集群环境中,由于所有的数据请求及响应的数据包都需要经过LVS调度器转发,如果后段服务器的数量大于10台,则调度器就会成为整个集群环境的瓶颈,我们知道,数据请求包往往远小于响应数据包的大小,因为响应数据包中包含有客户需要的具体数据,所以,LVS(TUN)的思路就是将请求与响应数据分离,让调度器仅处理数据请求,而让真实服务器响应数据包直接返回给客户端,vs/tun工作模式拓扑结构如图所示
其中IP隧道是一种数据包封装技术,他可以将原始数据包封装并添加新的报头从而实现将一个目标为调度器的VIP地址的数据包封装,通过隧道转发给后端的真实服务器,通过将客户端发往调度器的原始数据包封装。并在其基础上添加新的数据报头,
LVS(TUN)模式要求真实服务器可以直接与外部网络连接,真实服务器在收到请求数据包后直接给客户端主机响应数据。IP隧道模式与DR模式一样,请求直接由RS返回给客户端,不用经过DS
在这里插入图片描述

在这里插入图片描述
(1)当用户请求到达Director Server,此时请求的数据报文会先到内核空间的PREROUTING链,此时报文的源IP为iCIP,目标IP为VIP
(2)PREROUTING检查发现数据包的目标IP时本机,将数据包送至INPUT链
(3)IPVS比对数据包请求的服务是否为集群服务,若是,在请求报文的首部再次封装一次IP报文,封装源IP为DIP,目标IP为RIP,然后发质POSTROUTING链,此时源IP为DIP,目标IP 为RIP
(4)POSTROUTING链根据最新封装的IP报文,将数据包发至RS此时源IP为DIP,目标IP为RIP
(5)RS接收到报文后发现时自己的IP地址,就将报文接收下来,拆除掉最外层的IP后,会发现里面还有一层IP首部,而且目标是自己的lo接口VIP,那么此时RS开始处理此请求,处理完成后,通过lo接口送给eth0网卡,然后向外传递,此时的源IP地址为VIP,目标IP为CIP
(6)响应报文最终送达至客户端

LVS-TUN模式特性
RIP、VIP、DIP全是公网地址
RS的网关不会也不可能指向DIP
所有的请求报文经由Director Server,但响应报文必须不能进过Director Server 不支持端口映射 RS的系统必须支持隧道

4、LVS的负载均衡算法

1、轮询调度
轮询调度(Round Robin简称rr)算法就是按依次循环的方式将请求调度到不同的服务器上,该算法最大的特点就是实现简单,轮询算法假设所有的服务器处理请求的能力都是一样的,调度器会将所有的请求平均分配给每个真实服务器。
2、加权轮询调度
加权轮询(Weight Round Robin 简称WRR)算法主要是对轮询算法的一种优化与补充,LVS会考虑每台服务器的性能,并给每台服务器添加一个权值,如果服务器A的权值为1,服务器B的权值为2,则调度器调度到服务器B的请求会是服务器A的两倍,权值越高的服务器,处理的请求越多。
3、最小连接调度
最小连接调度(Least Connection简称LC)算法是把新的连接请求分配到当前连接数最小的服务器。最小连接调度是一种动态的调度算法。它通过服务器当前活跃的连接数来估计服务器的情况。调度器需要记录各个服务器已建立连接的数目,当一个请求被调度到某台服务器,其连接数加1;当连接中断或者超时时,其连接数减1。
4、加权最小连接调度
加权最小连接(Weight Least Connection 简称WLC)算法时最小连接调度的超集,各个服务器相应的权值表示其处理性能,服务器的缺省权值为1,系统管理员可以动态的设置服务器的权值,加权最小连接调度在调度新连接时尽可能使服务器的建立连接数和其权值成比例,调度器可以自动问询真实服务器的负载情况,并动态的调整其权值
5、基于局部的最少连接
基于局部的最少连接调度(Locality-Based Least Connection 简称LBLC)算法是针对请求报文的目标IP地址的负载均衡调度,目前主要用于Cache集群系统。因为在Cache集群客户请求报文的目标IP地址是变化的,这里假设任何后端服务器都可以处理任一要求,算法的设计目标是在服务器的负载基本平衡情况下,将相同目标ip地址的请求调度到同一台服务器,来提高各台服务器的访问局部性和Cache命中率,从而提升整个集群系统的处理能力,LBLC调度算法先根据请求的目标IP地址找出该目标IP地址最近使用的服务器,若该服务器是可用的且没有超载,将请求发送到该服务器,若服务器不存在,或者该服务器超载且有服务器处于一半的工作负载,则使用最少连接的原则选出一个可用的服务器,将请求发送到服务器。
6、带复制的基于局部性的最少连接
带复制的基于局部性的最少连接(Locality-Based Least Connections with Replication 简称’LBLCR’)算法也是针对目标IP地址的负载均衡,目前主要用于Cache集群系统,它与LBLC算法不同之处是它要维护从一个目标IP地址到一组服务器的映射,而LBLC算法维护从一个目标IP地址到一台服务器的映射。按’最小连接’原则从该服务器组中选出一一台服务器,若服务器没有超载,将请求发送到该服务器;若服务器超载,则按’最小连接’原则从整个集群中选出一台服务器,将该服务器加入到这个服务器组中,将请求发送到该服务器。同时,当该服务器组有一段时间没有被修改,将最忙的服务器从服务器组中删除,以降低复制的程度。

7.目标地址散列调度

目标地址散列调度(Destination Hashing 简称’DH’)算法先根据请求的目标IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且并未超载,将请求发送到该服务器,否则返回空。
8.源地址散列调度
源地址散列调度(Source Hashing 简称’SH’)算法先根据请求的源IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且并未超载,将请求发送到该服务器,否则返回空。它采用的散列函数与目标地址散列调度算法的相同,它的算法流程与目标地址散列调度算法的基本相似。
9.最短的期望的延迟
最短的期望的延迟调度(Shortest Expected Delay 简称’SED’)算法基于WLC算法。举个例子吧,ABC三台服务器的权重分别为1、2、3 。那么如果使用WLC算法的话一个新请求进入时它可能会分给ABC中的任意一个。使用SED算法后会进行一个运算
A:(1+1)/1=2 B:(1+2)/2=3/2 C:(1+3)/3=4/3 就把请求交给得出运算结果最小的服务器
10.最少队列调度

最少队列调度(Never Queue 简称’NQ’)算法,无需队列。如果有realserver的连接数等于0就直接分配过去,不需要在进行SED运算。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值