最值得收藏的LVS(Linux virual server)知识详细总结

目录

一、集群和分布式简介

1.1系统性能扩展方式

1.2集群Cluster

 1.3分布式

1.4集群和分布式

二、LVS(Linux virtual server)运行原理

2.1LVS简介

2.2LVS集群体系结构

2.3LVS概念

2.4LVS集群的类型

2.4.1NAT模式

 2.4.2DR模式

2.4.3TUN模式(只作了解):

2.4.4LVS工作模式总结

2.5LVS的调度算法

2.5.1LVS调度算法类型

2.5.2LVS静态调度算法

2.5.3LVS动态调度算法

三、LVS部署命令介绍

3.1LVS软件相关信息

3.2LVS集群中的增删改

四、LVS实战案列


一、集群和分布式简介

1.1系统性能扩展方式

  • Scale UP:向上扩展,增强
  • Scale Out:向外扩展,增加设备,调度分配问题,Cluster(集群)

1.2集群Cluster

Cluster:集群(是指一组相互连接的计算机和相关资源的集合)是为了解决某个特定问题将堕胎计算机组合起来形成的单个系统。

Cluster常见的三种类型:

  • LB:loadBalancing(负载均衡)由多个主机组成,每个主机只承担一部分访问
  • HA:

        High Availiablity(高可用)SPOF(single Point Of failure)

        MTBF:Mean Time Between Failure 平均无故障时间,正常时间

        MTTR:Mean Time To Restoration( repair)平均恢复前时间,故障时间

        A=MTBF/(MTBF+MTTR) (0,1):99%, 99.5%, 99.9%, 99.99%, 99.999%

        SLA:Service level agreement(服务等级协议)是在一定开销下为保障服务的性能和可用            性,服 务提供商与用户间定义的一种双方认可的协定。通常这个开销是驱动提供服务质量的          主要因素。在 常规的领域中,总是设定所谓的三个9,四个9来进行表示,当没有达到这种水          平的时候,就会有一 些列的惩罚措施,而运维,最主要的目标就是达成这种服务水平。

        停机时间又分为两种,一种是计划内停机时间,一种是计划外停机时间,而运维则主要关注            计划外 停机时间

  • HPC:High-performance computing(高性能计算,国家战略资源)

 1.3分布式

分布式存储:Ceph,GlusterFs,FastDFS,MogileFs

分布式计算:hadoop,Spark

分布式常见应用:

  • 分布式应用-服务按照功能拆分,使用微服务
  • 分布式静态资源--静态资源放在不同的存储集群上
  • 分布式数据和存储--使用key-value缓存系统
  • 分布式计算--对特殊业务使用分布式计算,比如Hadoop集群

1.4集群和分布式

  • 集群:同一个业务系统,部署在多台服务器上,集群中,每一台服务器实现的功能没有差别,数据 和代码都是一样的
  • 分布式:一个业务被拆成多个子业务,或者本身就是不同的业务,部署在多台服务器上。分布式 中,每一台服务器实现的功能是有差别的,数据和代码也是不一样的,分布式每台服务器功能加起 来,才是完整的业务
  • 分布式是以缩短单个任务的执行时间来提升效率的,而集群则是通过提高单位时间内执行的任务数 来提升效率
  • 对于大型网站,访问用户很多,实现一个群集,在前面部署一个负载均衡服务器,后面几台服务器 完成同一业务。如果有用户进行相应业务访问时,负载均衡器根据后端哪台服务器的负载情况,决 定由给哪一台去完成响应,并且台服务器垮了,其它的服务器可以顶上来。分布式的每一个节点, 都完成不同的业务,如果一个节点垮了,那这个业务可能就会失败

二、LVS(Linux virtual server)运行原理

2.1LVS简介

LVS:Linux Virtual Server,负载调度器,内核集成,章文嵩,阿里的四层SLB(Server LoadBalance)是基 于LVS+keepalived实现

LVS 官网: http://www.linuxvirtualserver.org/

LVS 相关术语:

  • VS: Virtual Server,负责调度
  • RS:RealServer,负责真正提供服务

2.2LVS集群体系结构

工作原理:VS根据请求报文的目标IP和目标协议及端口将其调度转发至某RS,根据调度算法来挑选RS

2.3LVS概念

  • VS:Virtual Server
  • RS:Real Server
  • CIP:Client IP
  • VIP: Virtual serve IP VS外网的IP
  • DIP: Director IP VS内网的IP
  • RIP: Real server IP

访问流程:CIP VIP == DIP RIP

2.4LVS集群的类型

lvs-nat: 修改请求报文的目标IP,多目标IP的DNAT

lvs-dr: 操纵封装新的MAC地址

lvs-tun: 在原请求IP报文之外新加一个IP首部

lvs-fullnat: 修改请求报文的源和目标IP

2.4.1NAT模式

LVS-NAT:

  • 本质是多目标IP的DNAT,通过将请求报文中的目标地址和目标端口修改为某挑出的RS的RIP和 PORT实现转发
  • RIP和DIP应在同一个IP网络,且应使用私网地址;RS的网关要指向DIP
  • 请求报文和响应报文都必须经由Director转发,Director易于成为系统瓶颈
  • 支持端口映射,可修改请求报文的目标PORT
  • VS必须是Linux系统,RS可以是任意OS系统

NAT模式数据逻辑:

1.客户端发送访问请求,请求数据包中含有请求来源(cip),访问目标地址(VIP)访问目标端口 (9000port)

2.VS服务器接收到访问请求做DNAT把请求数据包中的目的地由VIP换成RS的RIP和相应端

3.RS1相应请求,发送响应数据包,包中的相应保温为数据来源(RIP1)响应目标(CIP)相应端口 (9000port)

4.VS服务器接收到响应数据包,改变包中的数据来源(RIP1-->VIP),响应目标端口(9000-->80)

5.VS服务器把修改过报文的响应数据包回传给客户端

6.lvs的NAT模式接收和返回客户端数据包时都要经过lvs的调度机,所以lvs的调度机容易阻塞

NAT模式数据传输过程:

 客户请求到达vip后进入PREROUTING,在没有ipvs的时候因该进入本机INPUT,当IPVS存在后访问请求在通 过PREROUTING后被ipvs结果并作nat转发。

因为ipvs的作用点是在PREROUTING和INPUT链之间,所以如果在prerouting中设定规则会干扰ipvs的工 作。所以在做lvs时要把iptables的火墙策略全清理掉。

NAT模式特点:

1. 地址转换:
NAT 模式会对请求和响应的 IP 地址进行转换。客户端的请求到达 LVS 调度器时,调度器会将请求的目标 IP 地址转换为后端真实服务器的 IP 地址,并将响应的源 IP 地址从真实服务器转换为调度器的 IP 地址。

2. 可扩展性受限:
由于所有的请求和响应都需要经过调度器进行地址转换,当并发连接数较大时,调度器可能成为性能瓶颈,从而限制了系统的可扩展性。

例如,如果有大量的客户端同时发送请求,调度器处理地址转换的工作负载会急剧增加。

3. 后端服务器无需配置公网 IP:
后端的真实服务器可以使用私有 IP 地址,这在一定程度上节省了公网 IP 资源。

4. 配置相对简单:
对于一些小型的网络架构或者对性能要求不是特别高的场景,NAT 模式的配置相对较为简单,容易上手和管理。

 2.4.2DR模式

DR:Direct Routing,直接路由,LVS默认模式,应用最广泛,通过为请求报文重新封装一个MAC首部进行 转发,源MAC是DIP所在的接口的MAC,目标MAC是某挑选出的RS的RIP所在接口的MAC地址;源 IP/PORT,以及目标IP/PORT均保持不变

DR模式数据逻辑:

在DR模式中,RS接收到访问请求后不需要回传给VS调度器,直接把回传数据发送给client,所以RS和vs 上都要有vip

DR模式数据传输过程:

1.客户端发送数据帧给vs调度主机帧中内容为客户端IP+客户端的MAC+VIP+VIP的MAC

2.VS调度主机接收到数据帧后把帧中的VIP的MAC该为RS1的MAC,此时帧中的数据为客户端IP+客户端 的MAC+VIP+RS1的MAC

3.RS1得到2中的数据包做出响应回传数据包,数据包中的内容为VIP+RS1的MAC+客户端IP+客户端IP的 MAC

DR模式的特点:

1.Director和各RS都配置有VIP

2.确保前端路由器将目标IP为VIP的请求报文发往Director

3.在前端网关做静态绑定VIP和Director的MAC地址

  • 在RS上使用arptables工具

arptables -A IN -d $VIP -j DROP

arptables -A OUT -s $VIP -j mangle --mangle-ip-s $RIP

  •  在RS上修改内核参数以限制arp通告及应答级别

/proc/sys/net/ipv4/conf/all/arp_ignore

/proc/sys/net/ipv4/conf/all/arp_announce

4.RS的RIP可以使用私网地址,也可以是公网地址;RIP与DIP在同一IP网络

5.RIP的网关不能指向DIP,以确保响应报文不会经由Director

6.RS和Director要在同一个物理网络

7.请求报文要经由Director,但响应报文不经由Director,而由RS直接发往Client

8.不支持端口映射(端口不能修败)

9.RS可使用大多数OS系统

2.4.3TUN模式(只作了解):

转发方式:不修改请求报文的IP首部(源IP为CIP,目标IP为VIP),而在原IP报文之外再封装一个IP首部 (源IP是DIP,目标IP是RIP),将报文发往挑选出的目标RS;RS直接响应给客户端(源IP是VIP,目标IP 是CIP)

TUN模式数据传输过程:

1.客户端发送请求数据包,包内有源IP+vip+dport

2.到达vs调度器后对客户端发送过来的数据包重新封装添加IP报文头,新添加的IP报文头中包含 TUNSRCIP(DIP)+TUNDESTIP(RSIP1)并发送到RS1

3.RS收到VS调度器发送过来的数据包做出响应,生成的响应报文中包含SRCIP(VIP)+DSTIP(CIP) +port,响应数据包通过网络直接回传给client

TUN模式特点:

1.DIP, VIP, RIP都应该是公网地址

2.RS的网关一般不能指向DIP

3.请求报文要经由Director,但响应不能经由Director

4.不支持端口映射

5.RS的OS须支持隧道功能

2.4.4LVS工作模式总结

NAT模式TUN模式DR模式
RS操作系统不限支持隧道禁用ARP
调度器和服务器网络可跨网络可跨网络不可跨网络
调度服务器数量
RS服务器网关指向到调度DIP指向到路由指向到路由
  • lvs-nat与lvs-fullnat:请求和响应报文都经由Director
  • lvs-nat:RIP的网关要指向DIP
  • lvs-fullnat:RIP和DIP未必在同一IP网络,但要能通信
  • lvs-dr与lvs-tun:请求报文要经由Director,但响应报文由RS直接发往Client
  • lvs-dr:通过封装新的MAC首部实现,通过MAC网络转发
  • lvs-tun:通过在原IP报文外封装新IP头实现转发,支持远距离通信

2.5LVS的调度算法

2.5.1LVS调度算法类型

ipvs scheduler:根据其调度时是否考虑各RS当前的负载状态被分为两种:静态方法和动态方法

静态方法:仅根据算法本身进行调度,不考虑RS的负载情况

动态方法:主要根据每RS当前的负载状态及调度算法进行调度Overhead=value较小的RS将被调度

2.5.2LVS静态调度算法

1、RR:roundrobin 轮询 RS分别被调度,当RS配置有差别时不推荐

2、WRR:Weighted RR,加权轮询根据RS的配置进行加权调度,性能差的RS被调度的次数少

3、SH:Source Hashing,实现session sticky,源IP地址hash;将来自于同一个IP地址的请求始终发往 第一次挑中的RS,从而实现会话绑定

4、DH:Destination Hashing;目标地址哈希,第一次轮询调度至RS,后续将发往同一个目标地址的请 求始终转发至第一次挑中的RS,典型使用场景是正向代理缓存场景中的负载均衡,如:宽带运营商

2.5.3LVS动态调度算法

主要根据RS当前的负载状态及调度算法进行调度Overhead=value较小的RS会被调度

1、LC:least connections(最少链接)

适用于长连接应用Overhead(负载值)=activeconns(活动链接数) x 256+inactiveconns(非活 动链接数)

2、WLC:Weighted LC(权重最少链接)

默认调度方法Overhead=(activeconns x 256+inactiveconns)/weight

3、SED:Shortest Expection Delay

初始连接高权重优先Overhead=(activeconns+1+inactiveconns) x 256/weight

但是,当node1的权重为1,node2的权重为10,经过运算前几次的调度都会被node2承接

4、NQ:Never Queue,第一轮均匀分配,后续SED

5、LBLC:Locality-Based LC,动态的DH算法,使用场景:根据负载状态实现正向代理

6、LBLCR:LBLC with Replication,带复制功能的LBLC,解决LBLC负载不均衡问题,从负载重的复制 到负载轻的RS

在4.15版本内核以后新增的调度算法:

1.FO(Weighted Fai Over)调度算法:常用作灰度发布

在此FO算法中,遍历虚拟服务所关联的真实服务器链表,找到还未过载(未设置IP_VS_DEST_F OVERLOAD标志)的且权重最高的真实服务器,进行调度

当服务器承接大量链接,我们可以对此服务器进行过载标记(IP_VS_DEST_F OVERLOAD),那么vs调度 器就不会把链接调度到有过载标记的主机中。

2.OVF(Overflow-connection)调度算法

基于真实服务器的活动连接数量和权重值实现。将新连接调度到权重值最高的真实服务器,直到其活动 连接数量超过权重值,之后调度到下一个权重值最高的真实服务器,在此OVF算法中,遍历虚拟服务相关 联的真实服务器链表,找到权重值最高的可用真实服务器。一个可用的真实服务器需要同时满足以下条 件:

  • 未过载(未设置IP_VS_DEST_F OVERLOAD标志)
  • 真实服务器当前的活动连接数量小于其权重值
  • 其权重值不为零

三、LVS部署命令介绍

3.1LVS软件相关信息

  • 程序包:ipvsadm Unit File: ipvsadm.service
  • 主程序:/usr/sbin/ipvsadm
  • 规则保存工具:/usr/sbin/ipvsadm-save
  • 规则重载工具:/usr/sbin/ipvsadm-restore
  • 配置文件:/etc/sysconfig/ipvsadm-config
  • ipvs调度规则文件:/etc/sysconfig/ipvsadm

3.2LVS集群中的增删改

1、管理集群服务中的增删改

语法格式:ipvsadm -A|E -t|u|f service-address [-s scheduler] [-p [timeout]]

-A    添加
-D删除
-E

修改

-ttcp服务
-uudp服务
-s指定调度算法,默认为WLC
-p设置持久连接超时,持久连接可以理解为在同一个时间段同一个来源的请求调度到同一Realserver
-ffirewall mask 火墙标记,是一个数字

2、管理集群中RealServer的增删改

语法格式:ipvsadm -a|e -t|u|f service-address -r realserver-address [-g|i|m] [-w weight]

-a添加realserver
-d删除realserver
-e更改realserver
-ttcp协议
-uudp协议
-f防火墙标记
-rrealserver地址
-g直连路由模式
-i隧道模式
-mnat模式
-w设定权重
-Z(大写)清空计数器
-C(大写)清空lvs策略
-L

查看lvs策略

-n不做解析
--rate输出速率信息

pvs规则:/proc/net/ip_vs

ipvs连接:/proc/net/ip_vs_conn

四、LVS实战案列

【LVS】部署NAT模式集群icon-default.png?t=N7T8https://blog.csdn.net/weixin_63657273/article/details/141036854?spm=1001.2014.3001.5501【LVS】部署DR模式集群icon-default.png?t=N7T8https://blog.csdn.net/weixin_63657273/article/details/140965619?spm=1001.2014.3001.5501【LVS】防火墙mark标记解决调度问题icon-default.png?t=N7T8https://blog.csdn.net/weixin_63657273/article/details/141002444?spm=1001.2014.3001.5501

  • 18
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

new不出对象来

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值