一台服务器的硬件配置总是有限的,当服务器上运行的资源超过服务器的承载能力时,必将导致该服务器崩溃。在生产环境中,多数企业会使用多台服务器搭建成一个集群来运行应用程序,这样不仅可以避免单点故障,还能提升服务器的承载能力。
集群从功能实现上分为两种:高可用集群和负载均衡集群。高可用,就是当一台服务器宕机不能提供服务了,还有另外的服务器顶替。负载均衡集群,简单讲就是把用户的请求分摊到多台服务器上。
keepalived可以实现高可用,并且他还有负载均衡的功能。核心原理就是通过心跳线连接两台服务器,正常情况下由一台服务器提供服务,当这台服务器宕机,备用服务器顶替。
keepalived工作原理
VRRP(Virtual Router Redundancy Protocol,虚拟路由冗余协议)。它是实现路由高可用的一种通信协议,在这个协议里会将多台功能相同的路由器组成一个小组,这个小组里会有1个master(主)角色和N(N>=1)个backup(备用)角色。工作时,master会通过组播的形式向各个backup发送VRRP协议的数据包,当backup收不到master发来的VRRP数据包时,就会认为master宕机了。此时就需要根据各个backup的优先级来决定谁称为新的master。
而keepalived就是采用这种VRRP协议实现的高可用。keepalived要有三个模块,分别是core、check和vrrp。其中core模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析;check模块负责健康检查;vrrp模块用来实现VRRP协议。
安装keepalived
yum install -y keepalived
keepalived+Nginx实现Web高可用
把Nginx作为负载均衡器来用,它的重要性很高,一旦宕机会导致整个站点不能访问,所以很有必要再准备一台备用Nginx。用两台Nginx做负载均衡,每一台上都按照了keepalived,也就是说keepalived和Nginx安装在一起。133的nginx是通过源码进行安装的,134的是通过yum安装的,具体安装步骤查看其它博客。
- master:192.168.25.133 安装keepalived和Nginx
- backup:192.168.25.134 安装keepalived和Nginx
- VIP:192.168.25.100
VIP(Virtual IP),即虚拟IP,也有人把它叫做浮动IP。因为这个IP是由keepalived给服务器配置上的,服务器靠这个VIP对外提供服务,当master机器宕机,VIP被分配到backup上,这样用户看来是无感知的。
编辑master(133)的keepalived配置文件,vi /etc/keepalived/keepalived.conf
global_defs {
notification_email {
15732621728@163.com # 定义接收警告的人
}
notification_email_from root@163.com # 定义发邮件地址(实际上没用)
smtp_server 127.0.0.1 # 定义发邮件地址,若为127.0.0.1则使用本机自带邮件服务的脚本
smtp_connect_timeout 30
router_id LVS_DEVEL
}
vrrp_script chk_nginx { # chk_nginx为自定义名字,后面还会用到它
script "/usr/local/sbin/check_ng.sh" # 自定义脚本,该脚本为监控Nginx服务的脚本
interval 3 # 每隔3s执行一次该脚本
}
vrrp_instance VI_1 {
state MASTER # 角色为master,备份机的为BACKUP
interface ens33 # 针对哪个网卡监听VIP
virtual_router_id 51
priority 100 # 权重为100,master要比backup大
advert_int 1
authentication {
auth_type PASS
auth_pass 1111 # 定义密码,这个密码自定义
}
virtual_ipaddress {
192.168.25.100 # 定义VIP
}
track_script {
chk_nginx # 定义监控脚本,这里和上面的vrr_script后面的字符串保持一致
}
}
keepalived要实现高可用,监控nginx服务是必不可少的,它本身没有这个功能,需要借助自定义脚本实现,还需要定义一个监控Nginx服务的脚本。vi /usr/local/sbin/check_ng.sh
#!/bin/bash
#时间变量,用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
/etc/init.d/nginx start
n2=`ps -C nginx --no-heading|wc -l`
if [ $n2 -eq "0" ]; then
echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
systemctl stop keepalived
fi
fi
给此脚本添加执行权限,否则无法被keepalived调用
chmod a+x /usr/local/sbin/check_ng.sh
做完上面的操作就可以启动master上的keepalived了,如果没有启动nginx服务,它会帮我们自定拉起来,并监听vip。
systemctl start keepalived
ip addr
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN qlen 1
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
valid_lft forever preferred_lft forever
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
link/ether 00:0c:29:69:de:fa brd ff:ff:ff:ff:ff:ff
inet 192.168.25.133/24 brd 192.168.25.255 scope global ens33
valid_lft forever preferred_lft forever
inet 192.168.25.100/32 scope global ens33
valid_lft forever preferred_lft forever
inet6 fe80::bc7d:50c8:9001:213d/64 scope link
valid_lft forever preferred_lft forever
可以看到master上已经自动配置了192.168.25.100这个ip。再来看看nginx是否启动
ps aux|grep nginx
root 21622 0.0 0.1 45896 1120 ? Ss 11:45 0:00 nginx: master process /usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf
nobody 21623 0.0 0.1 46332 1892 ? S 11:45 0:00 nginx: worker process
master上已经大功告成,下面继续配置backup,首先编辑keepalived的配置文件,内容和master大部分一致,state和priority有变化。
state BACKUP
priority 90
编辑监控脚本
#!/bin/bash
#时间变量,用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
systemctl start nginx # 此处和master上有差异
n2=`ps -C nginx --no-heading|wc -l`
if [ $n2 -eq "0" ]; then
echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
systemctl stop keepalived
fi
fi
然后就可以启动备份机上的keepalived了,systemctl start keepalived。
使用ip addr名称查看,会发现这两台机器都拥有vip。如果master和backup都绑定了VIP,那么对外提供服务就会紊乱,这叫做脑裂,这种情况时不允许发生的。
先把SELinux关闭了。
产生脑裂的原因有很多,其中这里产生的原因是开启了iptables防火墙,阻止了心跳传消息输
在backup上执行
iptables -A INPUT -d 224.0.0.18 -j ACCEPT
让外界可以访问224.0.0.18。
之后就会发现只有master拥有虚拟ip了。然后我在master执行systemctl stop keepalived
,就会发现虚拟ip到backup上了。之后我再启动master的keepalived,会发现虚拟ip又回到了master上了。keepalived的日志默认是在/var/log/messages。
keepalive和脑裂问题 - 跪着行走的BoY - 博客园
https://www.cnblogs.com/dazhidacheng/p/8028474.html