Keepalived+Mysql双主热备高可用环境

最新推荐文章于 2024-09-27 15:37:19 发布

懒人笔记—001

最新推荐文章于 2024-09-27 15:37:19 发布

阅读量288

点赞数

本文链接：https://blog.csdn.net/ZHANG_TIMI/article/details/102849626

版权

Keepalived介绍

- keepalived 免费开源，具备第3、4、7层交换机的功能
- 主要提供 loadbalancing（负载均衡）和 high-availability（高可用）功能
- 负载均衡实现需要依赖Linux的虚拟服务内核模块（ipvs）
- 高可用是通过VRRP协议实现多台机器之间的故障转移服务
- 采用多进程的设计模式，每个进程负责不同的功能

Keepalived的功能体系结构

大致分两层结构：用户空间 user space和内核空间 kernel space

处于虚线下方的是内核空间

- IPVS(IP虚拟服务器)，用于实现网络服务的负载均衡
- NETLINK，提供高级路由及其他相关的网络功能

处于虚线上方的是用户空间

- WatchDog ：监控子进程VRRP和healthchecker的状况
- Checkers ：负责真实服务器的健康检查healthchecking，是keepalived最主要的功能
- VRRP Stack：负责负载均衡器之间的失败切换 FailOver
- IPVS wrapper ：用来发送设定的规则到内核 ipvs代码
- Netlink Reflector ：用来设定 vrrp 的vip地址等

VRRP( Virtual Router Redundancy Protocol )协议

- 用于实现路由器冗余的协议
- 解决静态路由单点故障问题
- 通过一种竞选(election)协议来实现虚拟路由器的功能

IPVS( IP Virtual Server )

Keepalived里面所有对LVS的相关操作并不直接使用ipvsadm这样的用户端程序，而是直接使用IPVS提供的函数进程操作，该代码都在check/ipwrapper.c中

1）先实施Master->Slave的主主同步。主主是数据双向同步，主从是数据单向同步。一般情况下，主库宕机后，需要手动将连接切换到从库上。（但是用keepalived就可以自动切换）
2）再结合Keepalived的使用，通过VIP实现Mysql双主对外连接的统一接口。即客户端通过Vip连接数据库；当其中一台宕机后，VIP会漂移到另一台上，这个过程对于客户端的数据连接来说几乎无感觉，从而实现高可用。

MySQL主从与双主搭建请参考：http://www.cnblogs.com/wade-lt/p/9008058.html

环境描述：

mysql的安装可以参考：http: //www .cnblogs.com /kevingrace/p/6109679 .html

Centos7.4版本

Master：192.168.0.103 安装mysql和keepalived

Slave : 192.168.0.104 安装mysql和keepalived

VIP：192.168.0.102

要实现主主同步，可以先实现主从同步，即master1->master2的主从同步，然后master2->master1的主从同步.

这样，双方就完成了主主同步。

配置Mysql+Keepalived故障转移的高可用环境

 
1）安装keepalived并将其配置成系统服务。master和salve两台机器上同样进行如下操作：
[root@master ~]# yum install -y openssl-devel        #安装依赖
[root@master ~]# cd /tmp
[root@master src]# tar -zvxf keepalived-1.4.3.tar.gz   #官网下载并上传至服务器：http://www.keepalived.org/software/（官网）
[root@master src]# cd keepalived-1.4.3
[root@master keepalived-1.4.3]# ./configure --prefix=/usr/local/keepalived
[root@master keepalived-1.4.3]# make && make install
     
[root@master keepalived-1.4.3]# cp /usr/local/src/keepalived-1.4.3/keepalived/etc/init.d/keepalived /etc/rc.d/init.d/
[root@master keepalived-1.4.3]# cp /usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/
[root@master keepalived-1.4.3]# mkdir /etc/keepalived/
[root@master keepalived-1.4.3]# cp /usr/local/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/
[root@master keepalived-1.4.3]# cp /usr/local/keepalived/sbin/keepalived /usr/sbin/
[root@master keepalived-1.4.3]# echo "/etc/init.d/keepalived start" >> /etc/rc.local   #centos 7 /etc/rc.local ---> /etc/rc.d/rc.local 未能开启自启，修改文件

2）配置master机器上的keepalived.conf配置。（下面配置中没有使用lvs的负载均衡功能，所以不需要配置虚拟服务器virtual server）
注：keepalive.conf文件不能添加多余的字符如“#”注释等，“{}”与标识之间要空一个字符，keepalive.conf详解参考：https://www.cnblogs.com/along1226/p/5027838.html
[root@master ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak
[root@master ~]# vim /etc/keepalived/keepalived.conf       ＃清空默认内容，直接采用下面配置：    
! Configuration File for keepalived

global_defs {
   notification_email {   #指定keepalived在发生切换时需要发送email到的对象，一行一个
     acassen@firewall.loc
     failover@firewall.loc
     sysadmin@firewall.loc
   }
   notification_email_from Alexandre.Cassen@firewall.loc  #指定发件人
   smtp_server 127.0.0.1     #指定smtp服务器地址
   smtp_connect_timeout 30    #指定smtp连接超时时间
   router_id MASTER-HA       #运行keepalived机器的一个标识
}

vrrp_script chk_mysql_port {      #检测mysql服务是否在运行。有很多方式，比如进程，用脚本检测等等
    script "/opt/chk_mysql.sh"   #这里通过脚本监测
    interval 2           #脚本执行间隔，每2s检测一次
    weight -5            #脚本结果导致的优先级变更，检测失败（脚本返回非0）则优先级 -5
    fall 2             #检测连续2次失败才算确定是真失败。会用weight减少优先级（1-255之间
    rise 1             #检测1次成功就算成功。但不修改优先级
}

vrrp_instance VI_1 {
    state MASTER            #指定那个为master，那个为backup，如果设置了nopreempt这个值不起作用，主备由priority决定
    interface ens33           #设置实例绑定的网卡
    mcast_src_ip 192.168.0.103      #发送多播包的地址，如果不设置默认使用绑定网卡的primary ip
    virtual_router_id 51         #路由器标识，MASTER和BACKUP必须是一致的
    priority 101             #定义优先级，数字越大，优先级越高，在同一个vrrp_instance下，MASTER的优先级必须大于BACKUP的优先级。这样MASTER故障恢复后，就可以将VIP资源再次抢回来
    advert_int 1             #检查间隔，默认1秒
    authentication {#设置认证
        auth_type PASS #认证方式
        auth_pass 1111 #认证密码
    }
    virtual_ipaddress {#设置vip
        192.168.0.102/24         #与绑定的网卡实ip掩码相同
    }
    track_script {  #mysql脚本检测
        chk_mysql_port
    }
}

3）编写切换脚本。KeepAlived做心跳检测，如果Master的MySQL服务挂了(3306端口挂了),那么它就会选择自杀。Slave的KeepAlived通过心跳检测发现这个情况，就会将VIP的请求接管
[root@master ~]# vim /opt/chk_mysql.sh
#!/bin/bash
counter=$(netstat -na|grep "LISTEN"|grep "3306"|wc -l)
if [ "${counter}" -eq 0 ]; then
    /etc/init.d/keepalived stop
fi

[root@master ~]# chmod 755 /opt/chk_mysql.sh

启动keepalived服务
[root@master ~]# /etc/init.d/keepalived start
正在启动 keepalived：                                      [确定]

4）slave机器上的keepalived配置。slave机器上的keepalived.conf文件只修改priority为99、nopreempt不设置、real_server设置本地IP。

[root@slave ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak

[root@slave ~]# vim /etc/keepalived/keepalived.conf
! Configuration File for keepalived

global_defs {
   notification_email {
     acassen@firewall.loc
     failover@firewall.loc
     sysadmin@firewall.loc
   }
   notification_email_from Alexandre.Cassen@firewall.loc
   smtp_server 127.0.0.1
   smtp_connect_timeout 30
   router_id MASTER-HA
}

vrrp_script chk_mysql_port {
    script "/opt/chk_mysql.sh"
    interval 2
    weight -5
    fall 2
    rise 1
}

vrrp_instance VI_1 {
    state BACKUP
    interface ens33
    mcast_src_ip 192.168.0.104
    virtual_router_id 51
    priority 99
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        192.168.0.102/24
    }
    track_script {
        chk_mysql_port
    }
   
}

     
[root@slave ~]# cat /opt/chk_mysql.sh
#!/bin/bash
counter=$(netstat -na|grep "LISTEN"|grep "3306"|wc -l)
if [ "${counter}" -eq 0 ]; then
    /etc/init.d/keepalived stop
fi
 
[root@slave ~]# chmod 755 /opt/chk_mysql.sh
     
[root@slave ~]# /etc/init.d/keepalived start
正在启动 keepalived：                                      [确定]

注：如有防火墙，请开放相关权限，如：两台主机之间的通信，vrrp通信以及mysql的3306端口，关闭selinux /etc/selinux/conf ,修改后并使之生效

Mysql＋keepalived故障转移的高可用测试

1）通过Mysql客户端通过VIP连接，看是否连接成功。
比如，在远程一台测试机上连接，通过vip地址可以正常连接（下面的连接权限要是在服务端提前授权的）
[root@dev-new-test ~]# mysql -h192.168.0.103 -uroot -p123456

2）默认情况下，vip是在master上的。使用"ip a"命令查看vip切换情况
[root@master ~]# ip a

停止master机器上的mysql服务，根据配置中的脚本，mysql服务停了，keepalived也会停，从而vip资源将会切换到slave机器上。（mysql服务没有起来的时候，keepalived服务也无法顺利启动！）
[root@master ~]# /etc/init.d/mysql stop
Shutting down MySQL.. SUCCESS!
[root@master ~]# ps -ef|grep mysql
root     25812 21588 0 17:30 pts/0    00:00:00 grep mysql
[root@master ~]# ps -ef|grep keepalived
root     25814 21588 0 17:30 pts/0    00:00:00 grep keepalived
[root@master ~]# ip addr
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
    inet6 ::1/128 scope host
       valid_lft forever preferred_lft forever
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
    link/ether 52:54:00:3c:25:42 brd ff:ff:ff:ff:ff:ff
    inet 192.168.0.103/24 brd 192.168.0.255 scope global ens33
    inet6 fe80::5054:ff:fe3c:2542/64 scope link
       valid_lft forever preferred_lft forever

如上结果，发现vip没有了，说明此时vip资源已不在master机器上了
查看下master的系统日志，如下，会发现vip资源已经切换走了
[root@master ~]# tail -f /var/log/messages

再到slave机器上，发现vip资源的确切换过来了
[root@slave ~]# ip addr
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
    inet6 ::1/128 scope host
       valid_lft forever preferred_lft forever
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
    link/ether 52:54:00:95:1f:6d brd ff:ff:ff:ff:ff:ff
    inet 192.168.0.104/24 brd 192.168.0.255 scope global ens33
    inet 192.168.0.102/24 scope global ens33
    inet6 fe80::5054:ff:fe95:1f6d/64 scope link
       valid_lft forever preferred_lft forever
查看slave的系统日志
[root@slave ~]# tail -f /var/log/messages

3）再次启动master的mysql和keepalived服务。（注意：如果restart重启mysql，那么还要启动下keepalived，因为mysql重启，根据脚本会造成keepalived关闭）
注意：一定要先启动mysql服务，然后再启动keepalived服务。如果先启动keepalived服务，按照上面的配置，mysql没有起来，就会自动关闭keepalived。
[root@master ~]# /etc/init.d/mysql start
Starting MySQL.. SUCCESS!

[root@master ~]# /etc/init.d/keepalived start
正在启动 keepalived：                                      [确定]

启动这两个服务器后，稍微等过一会儿，注意观察会发现vip资源再次从slave机器上切换回来了。
[root@master ~]# ip addr
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
    inet6 ::1/128 scope host
       valid_lft forever preferred_lft forever
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
    link/ether 52:54:00:3c:25:42 brd ff:ff:ff:ff:ff:ff
    inet 192.168.0.103/24 brd 192.168.0.255 scope global ens33
    inet 192.168.0.102/24 scope global ens33
    inet6 fe80::5054:ff:fe3c:2542/64 scope link
       valid_lft forever preferred_lft forever

[root@master ~]# tail -f /var/log/messages

再看看slave机器，发现vip资源又被恢复后的master抢过去了
[root@slave ~]# ip addr
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
    inet6 ::1/128 scope host
       valid_lft forever preferred_lft forever
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
    link/ether 52:54:00:95:1f:6d brd ff:ff:ff:ff:ff:ff
    inet 192.168.0.104/24 brd 192.168.0.255 scope global ens33
    inet6 fe80::5054:ff:fe95:1f6d/64 scope link
       valid_lft forever preferred_lft forever

[root@slave ~]# tail -f /var/log/messages

4）同样，关闭master1机器的keepalived服务，vip资源会自动切换到master2机器上。当master1的keepalived服务恢复后，会将vip资源再次切回来。

以上在vip资源切换过程中，对于客户端连接mysql（使用vip连接）来说几乎是没有任何影响的。

------------------------------------温馨提示（Keepalived的抢占和非抢占模式）---------------------------------------
keepalive是基于vrrp协议在linux主机上以守护进程方式，根据配置文件实现健康检查。
VRRP是一种选择协议，它可以把一个虚拟路由器的责任动态分配到局域网上的VRRP路由器中的一台。
控制虚拟路由器IP地址的VRRP路由器称为主路由器，它负责转发数据包到这些虚拟IP地址。
一旦主路由器不可用，这种选择过程就提供了动态的故障转移机制，这就允许虚拟路由器的IP地址可以作为终端主机的默认第一跳路由器。

keepalive通过组播，单播等方式（自定义），实现keepalive主备推选。工作模式分为抢占和非抢占（通过参数nopreempt来控制）。
1）抢占模式：
主服务正常工作时，虚拟IP会在主上，备不提供服务，当主服务优先级低于备的时候，备会自动抢占虚拟IP，这时，主不提供服务，备提供服务。
也就是说，工作在抢占模式下，不分主备，只管优先级。

如上配置，不管keepalived.conf里的state配置成master还是backup，只看谁的priority优先级高（一般而言，state为MASTER的优先级要高于BACKUP）。
priority优先级高的那一个在故障恢复后，会自动将VIP资源再次抢占回来！！

2）非抢占模式：
这种方式通过参数nopreempt（一般设置在advert_int的那一行下面）来控制。不管priority优先级，只要MASTER机器发生故障，VIP资源就会被切换到BACKUP上。
并且当MASTER机器恢复后，也不会去将VIP资源抢占回来，直至BACKUP机器发生故障时，才能自动切换回来。

千万注意：
nopreempt这个参数只能用于state为backup的情况，所以在配置的时候要把master和backup的state都设置成backup，这样才会实现keepalived的非抢占模式！

也就是说：
a）当state状态一个为master，一个为backup的时候，加不加nopreempt这个参数都是一样的效果。即都是根据priority优先级来决定谁抢占vip资源的，是抢占模式！
b）当state状态都设置成backup，如果不配置nopreempt参数，那么也是看priority优先级决定谁抢占vip资源，即也是抢占模式。
c）当state状态都设置成backup，如果配置nopreempt参数，那么就不会去考虑priority优先级了，是非抢占模式！即只有vip当前所在机器发生故障，另一台机器才能接管vip。
即使优先级高的那一台机器恢复后也不会主动抢回vip，只能等到对方发生故障，才会将vip切回来。

---------------------------------mysql状态检测脚本优化---------------------------------
案例一：
上面的mysql监测脚本有点过于简单且粗暴，即脚本一旦监测到Master的mysql服务关闭，就立刻把keepalived服务关闭，从而实现vip转移！

下面对该脚本进行优化，优化后，当监测到Master的mysql服务关闭后，就会将vip切换到Backup上（但此时Master的keepalived服务不会被暴力kill）
当Master的mysql服务恢复后，就会再次将VIP资源切回来！

[root@master ~]# cat /opt/chk_mysql.sh
#!/bin/bash
MYSQL=/usr/bin/mysql
MYSQL_HOST=localhost
MYSQL_USER=root
MYSQL_PASSWORD=root
CHECK_TIME=3

#mysql is working MYSQL_OK is 1 , mysql down MYSQL_OK is 0

MYSQL_OK=1

function check_mysql_helth (){
    $MYSQL -h $MYSQL_HOST -u $MYSQL_USER -p${MYSQL_PASSWORD} -e "show status;" >/dev/null 2>&1
    if [ $? = 0 ] ;then
    MYSQL_OK=1
    else
    MYSQL_OK=0
    fi
    return $MYSQL_OK
}
while [ $CHECK_TIME -ne 0 ]
do
    let "CHECK_TIME -= 1"
    check_mysql_helth
if [ $MYSQL_OK = 1 ] ; then
    CHECK_TIME=0
    exit 0
fi
if [ $MYSQL_OK -eq 0 ] && [ $CHECK_TIME -eq 0 ]
then
    pkill keepalived
    exit 1
fi
sleep 1
done

案例二：

[root@master opt]# cat chk_mysql.sh
#!/bin/bash
MYSQL=/usr/bin/mysql
MYSQL_HOST=localhost
MYSQL_USER=root
MYSQL_PASSWORD=root
CHECK_TIME=3
#mysql is working MYSQL_OK is 1 , mysql down MYSQL_OK is 0
MYSQL_OK=1
VIP=192.168.0.102
function check_mysql_helth ()
{
     $MYSQL -h $MYSQL_HOST -u $MYSQL_USER -p${MYSQL_PASSWORD} -e "show status;" >/dev/null 2>&1
     if [ $? -eq 0 ] ;then
            MYSQL_OK=1
     else
            MYSQL_OK=0
        fi
     return $MYSQL_OK
}

while [ $CHECK_TIME -ne 0 ]
do
     let "CHECK_TIME -= 1"
     check_mysql_helth
   if [ $MYSQL_OK = 1 ] ; then
      CHECK_TIME=0
      exit 0
fi

ip a|grep $VIP
if [ $? -eq 0 ] && [ $CHECK_TIME -eq 0 ];then
      mount /dev/mapper/mpathb /opt/diskarray
      echo "vip is here,mysql is down"
      service mysqll restart

     if [ $? -ne 0 ];then
       echo "vip is here,but mysql is not work !"
       /etc/init.d/keepalived restart
       umount /dev/mapper/mpathb
       exit 1
     fi
       exit 3
   elif [ $MYSQL_OK -eq 0 ] && [ $CHECK_TIME -eq 0 ];then
      echo " not vip , 2th check mysql is down "
      exit 5
   fi
      sleep 2
done