keepalived出现主备机同时绑定vip的解决方法

最近项目需要,用到了keepalived+nginx模式,由于以前没接触过keepalived,所以遇到了一些问题,花了最多时间来解决的就是keepalived启动之后,主机与备份机都绑定了虚拟ip,也就是产生了所谓的“脑裂”现象,解决这个问题,找了能有几十篇文章,虽然都没有直接解决我的问题,但是却给了我解决问题的思路,特此记录一下,希望能帮助别人,也能告诫自己。

1、keepalived配置情况

主机(192.168.252.128)配置:

! Configuration File for keepalived

global_defs {
   notification_email {
    # acassen@firewall.loc
    # failover@firewall.loc
     #sysadmin@firewall.loc
   }
   #notification_email_from Alexandre.Cassen@firewall.loc
   #smtp_server 192.168.200.1
   #smtp_connect_timeout 30
   router_id LVS_128
   vrrp_skip_check_adv_addr
   #vrrp_strict
   vrrp_garp_interval 0
   vrrp_gna_interval 0
}
#健康检测脚本,必须声明在vrrp_instance节点前
vrrp_script chk_nginx {
        script "/etc/keepalived/nginx_check.sh" ## 检测 nginx 状态的脚本路径
        interval 3 ## 检测时间间隔
        weight -20 ## 如果条件成立,权重-20
}
#vrrp实例设置
vrrp_instance VI_1 {
    state MASTER  #MASTER为主机
    interface ens33  #虚拟ip绑定的网卡
    virtual_router_id 99 #虚拟路由ID标识,一组的keepalived配置中主备都是设置一致
    priority 100   #优先级,主机应高于备份机即可
    advert_int 1 
    authentication {
        auth_type PASS #认证方式
        auth_pass 123456  #认证密码
    }
    virtual_ipaddress {
        192.168.252.131 #虚拟ip
    }
    track_script {
        chk_nginx ## 执行 Nginx 监控的服务
    }
}

备份机(192.168.252.129)配置:

! Configuration File for keepalived

global_defs {
   notification_email {
     #acassen@firewall.loc
     #failover@firewall.loc
     #sysadmin@firewall.loc
   }
   #notification_email_from Alexandre.Cassen@firewall.loc
   #smtp_server 192.168.200.1
   #smtp_connect_timeout 30
   router_id LVS_129
   vrrp_skip_check_adv_addr
   #vrrp_strict
   vrrp_garp_interval 0
   vrrp_gna_interval 0
}

vrrp_script chk_nginx {
        script "/etc/keepalived/nginx_check.sh" ## 检测 nginx 状态的脚本路径
        interval 3 ## 检测时间间隔
        weight -20 ## 如果条件成立,权重-20
}

vrrp_instance VI_1 {
    state BACKUP
    interface ens33
    virtual_router_id 99
    priority 90
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 123456
    }
    virtual_ipaddress {
        192.168.252.131
    }
    track_script {
        chk_nginx ## 执行 Nginx 监控的服务
     }
}

健康检查的脚本就不发了,因为这个问题和脚本无关,我那会启动keepalived之后还并没有尝试关闭nginx来测试keepalived存活情况。

2、问题解析

从主备机配置上来看,并没有会出现脑裂情况的配置,理论上主备机的配置只要注意:router_id局域网内唯一,主备机不同;virtual_router_id主备机配置一致;priority主机高于备份机; virtual_ipaddress主备机一致,差不多就可以了。
启动keepalived之后,主机与备份机的vip绑定情况如下:
主机vip绑定情况
备份机vip绑定情况
问题解决过程:
首先在128主机上用tcpdump抓包,监控一下ens33,也就是绑定了vip的网卡的报文,发现如下:

[guansheng@lgs keepalived]$ sudo tcpdump -i ens33 vrrp -n

抓包情况
128(主机)和129(备份机)两台机器在轮询往224.0.0.18(vrrp的组播地址)发送报文。理论上来说,主机处于活跃状态的时候,备份机收到报文之后是不会发送组播消息的,这个很明显就是备份机没收到主机的组播报文。
在129上抓包,也发现同样的输出。
再三检查之后,确定配置没问题,所以就把问题锁定在主备机与组播ip之间的通信问题上。
我的防火墙不是iptables,所以网上很多iptables的方法不能用,一些setenforce 0的命令也用了,发现不起作用,最后查了一下firewall开启组播通信的方法:
运行以下命令:

[guansheng@lgs keepalived]$ firewall-cmd --direct --permanent --add-rule ipv4 filter INPUT 0 --in-interface ens33 --destination 224.0.0.18 --protocol vrrp -j ACCEPT
#刷新防火墙
[guansheng@lgs keepalived]$ firewall-cmd --reload;

其中INPUT 0 --in-interface ens33这段的ens33是绑定了vip的网卡,替换成自己的网卡就可以了。
主备机都运行之后,直接查看vip的绑定情况,发现已经恢复正常:
主机绑定vip
从机VIP取消绑定
再监控一下ens33网卡报文情况:
ens33报文情况
发现全都是128在发报文,129暂停发送了,到此问题解决

  • 16
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 10
    评论
在使用 keepalived 实现高可用性的时候,备机抢占 VIP 是必要的。当机宕机时,备机需要立即接管 VIP,以保证服务的可用性。 下面是一个简单的 keepalived 配置示例,用于实现备机抢占 VIP: ``` global_defs { router_id LVS_DEVEL } vrrp_instance VI_1 { state BACKUP interface eth0 virtual_router_id 51 priority 100 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 192.168.1.100 } track_script { chk_http_port } } virtual_server 192.168.1.100 80 { delay_loop 6 lb_algo wrr lb_kind DR persistence_timeout 50 protocol TCP real_server 192.168.1.1 80 { weight 1 TCP_CHECK { connect_timeout 3 nb_get_retry 3 delay_before_retry 3 connect_port 80 } } real_server 192.168.1.2 80 { weight 1 TCP_CHECK { connect_timeout 3 nb_get_retry 3 delay_before_retry 3 connect_port 80 } } } ``` 在这个配置中,vrrp_instance 定义了一个 VIP,其状态为 BACKUP。当机宕机时,备机将接管 VIP。priority 定义了备机的优先级,数字越大优先级越高。virtual_ipaddress 定义了 VIP 的地址。 virtual_server 定义了一个虚拟服务器,其 IP 地址为 192.168.1.100,端口为 80。real_server 定义了实际的服务器。在实际的服务器定义中,TCP_CHECK 定义了检查服务器可用性的方式,其它参数的含义可以查看 keepalived 的文档。 当机宕机时,备机将接管 VIP,并将流量转发到实际的服务器。这样可以保证服务的可用性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值