一、LVS(Linux virual server)是什么?
LVS(Linux virual server) :是 Linux 下的虚拟服务器集群系统。它主要用于实现服务器集群的负载均衡,可以将多台服务器组合成一个高性能、高可用的服务器集群,将外部请求均衡地分配到集群中的各个服务器上,从而提高系统的处理能力和可靠性。
二、集群Cluster和分布式介绍
2.1 集群Cluster
Cluster:集群是为了解决某个特定问题将多台计算机组合起来形成的单个系统。
cluster常见的三种类型:
- 高可用性集群(High Availability Cluster):旨在确保关键业务系统持续运行,当一个节点出现故障时,其他节点能够迅速接管,以减少停机时间。
- 负载均衡集群(Load Balancing Cluster):将工作负载分布到多个节点上,以提高系统的整体性能和吞吐量,确保资源得到合理利用。
- 高性能计算集群(High Performance Computing Cluster):主要用于大规模科学计算、数据分析等需要强大计算能力的领域,通过将多个计算节点连接在一起,实现高效的并行计算。
例如,在网络服务器中,高可用性集群可以保证服务的不间断;在大型网站中,负载均衡集群可以分担访问压力;在科研领域,高性能计算集群可以加速复杂的计算任务。
2.2 分布式
分布式系统是将多台计算机通过网络连接在一起,共同完成特定任务的系统。在分布式系统中,任务被分解成多个子任务,分布到不同的节点上执行,从而实现资源共享、提高系统的性能、扩展性和容错能力。
它具有以下特点:
- 分布性:系统中的资源和组件分布在不同的物理位置。
- 并发性:多个任务可以同时执行。
- 透明性:系统对用户隐藏了底层的分布式特性。
- 异构性:系统中的节点可能具有不同的硬件和软件配置。
分布式系统在互联网、云计算、大数据等领域都有广泛应用,例如分布式数据库、分布式文件系统等。
2.3、集群和分布式
介绍:
集群:同一个业务系统,部署在多台服务器上,集群中,每一台服务器实现的功能没有差别,数据
和代码都是一样的。
分布式:一个业务被拆成多个子业务,或者本身就是不同的业务,部署在多台服务器上。分布式中,每一台服务器实现的功能是有差别的,数据和代码也是不一样的,分布式每台服务器功能加起来,才是完整的业务。
区别:
分布式:是以缩短单个任务的执行时间来提升效率的。
集群:则是通过提高单位时间内执行的任务数来提升效率,
三、LVS运行的原理
3.1、LVS基本概念
VS:Virtual Server(虚拟服务器):这是整个集群对外提供服务的统一入口,客户端通过访问虚拟服务器的 IP 地址来获取服务。
RS:Real Server(真实服务器):实际处理业务请求的服务器,它们组成了服务器集群,共同承担负载。
CIP:Client IP(客户端 IP):发起请求的客户端的 IP 地址。
VIP:Virtual Server IP(虚拟服务器 IP 地址):通常是一个对外公开的、可被客户端访问到的 IP 地址,代表了整个集群。
DIP:Director IP(调度器 IP 地址):即负载均衡器的 IP 地址,用于接收客户端请求并进行分配调度。
RIP:Real Server IP(真实服务器 IP 地址):集群中各真实服务器的 IP 地址。
例如,在一个网络架构中,客户端通过 VIP 访问服务,负载均衡器(VS)使用 DIP 接收请求,并将其分配到各个 RS 上,RS 使用 RIP 进行实际的业务处理。
LVS工作原理:VS根据请求报文的目标IP和目标协议及端口将其调度转发至某RS,根据调度算法来挑选RS。
3.2、LVS集群的类型
类型:
类型 | 说明 |
lvs-net | 修改请求报文的目标IP,多目标IP的DNAT |
lvs-dr | 操纵封装新的MAC地址 |
lvs-tun (了解) | 在原请求IP报文之外新加一个IP首部 |
lvs-fullnat(了解) | 修改请求报文的源和目标IP |
3.2.1 LVS - NAT模式
lvs-nat:本质是多目标IP的DNAT,通过将请求报文中的目标地址和目标端口修改为某处的RS的RIP和
PORT实现转发
(1)RIP和DIP应在同一个IP网络,且应使用私网地址;RS的网关要指向DIP
(2)请求报文和响应报文都必须经由Director转发,Director易于成为系统瓶颈
(3)支持端口映射,可修改请求报文的目标PORT
(4)VS必须是Linux系统,RS可以是任意OS系统
LVS算法:
静态:
1、RR : roundrobin 轮询 RS 分别被调度,当 RS 配置有差别时不推荐
2 、 WRR : Weighted RR ,加权轮询根据 RS 的配置进行加权调度,性能差的 RS 被调度的次数少
动态:
1、LC : least connections (最少链接发)
适用于长连接应用 Overhead (负载值) =activeconns (活动链接数) x 256+inactiveconns (非活
动链接数)
2 、 WLC : Weighted LC (权重最少链接)
默认调度方法 Overhead=(activeconns x 256+inactiveconns)/weight
3 、 SED : Shortest Expection Delay,
初始连接高权重优先 Overhead=(activeconns+1+inactiveconns) x 256/weight
但是,当 node1 的权重为 1 , node2 的权重为 10 ,经过运算前几次的调度都会被 node2 承接
环境部署
需要三台虚拟机,分别表示为LVS、web1和web2
LVS:IP:172.25.254.100(nat) 192.268.0.100(仅主机)
web1:IP:192.168.0.10(仅主机)网关:192.168.0.100
web2:IP:192.168.0.20(仅主机)网关:192.168.0.100
web1和web2需要安装http服务
在lvs中打开内核路由功能
web1设置
web2设置
下载ipvsadm
策略中添加 ipvsadm -ln 查看策略
模式NAT实验完成
清空策略
永久保存策略
ipvsadm-save /etc/sysconfig/ipvsadm
添加策略权限
ipvsadm -E
添加权限
添加权重
3.2.2LVS-DR模式
DR 模式集群(Disaster Recovery Cluster) 是一种用于灾难恢复的集群模式。
在这种模式下,集群中的节点通常处于备用状态,随时准备在主节点发生故障或灾难时接管业务,以确保业务的连续性和数据的安全性。
例如,在金融行业,DR 模式集群可以在主数据中心遭受灾害时,迅速切换到备用数据中心,保障业务的正常运行。
需要五台虚拟主机,分别为client客户机、router路由、LVS 、web1和web2
client:172.25.254.200(nat) 网关:172.25.254.100
router路由:172.25.254.100(nat) 192.168.0.100(仅主机)
lvs :192.168.0.50(仅主机) 网关:192.168.0.100
web1 :192.168.0.10 (仅主机)网关:192.168.0.100
web1 :192.168.0.20 (仅主机)网关:192.168.0.100
client IP 设置
lvs IP 设置
ip a a 192.168.0.200/32 dev lo 为设置LVS的VIP
web1 ip设置 echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore
echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce
echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce
echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore
web2 ip设置web2 IP设置
ip a a 192.168.0.200/32 dev lo 为添加web2的VIP
echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore
echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce
echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce
echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore
是web2中的VIP不对外响应route中打开路由内核
在LVS中添加ipvsadm策略
client机中进行测试
3.2.3 LVS 中防火墙标记
LVS FWM防火墙标记 防火墙标记的作用是:借助于防火墙标记来分类报文,然后基于标记定义集群服务;可将多个不同的应用使用同一个集群服务进行调度。
web1 和 web2都安装mod_ssl模块,作用是使rs支持https,并重启httpd服务
lvs中做端口标记iptables -t mangle -nL查看是否添加成功,结果数字会以16进制显示
添加策略
进行测试 实验成功
3.2.4 lvs持久链接
在我们客户上网过程中有很多情况下需要和服务器进行交互,客户需要提交响应信息给服务器,如果单纯的进行调度会导致客户填写的表单丢失,为了解决这个问题我们可以用sh算法,但是sh算法比较简单粗暴,可能会导致调度失衡。
解决方法:在进行调度时,不管用什么算法,只要相同源过来的数据包我们就把他的访问记录在内存中,也就是把这个源的主机调度到了那个RS上如果在短期(默认360S)内同源再来访问我仍然按照内存中记录的调度信息,把这个源的访问还调度到同一台RS上。如果过了比较长的时间(默认最长时间360s)同源访问再次来访,那么就会被调度到其他的RS上 。
添加持久链接
轮询查看
再轮询查看