mysql5.7—MHA架构下的高可用半同步复制_multi-master configuration is detected, but all of-CSDN博客

本文链接：https://blog.csdn.net/gd0306/article/details/84932824

MHA架构下的Mysql高可用半同步复制

MHA架构的详细介绍、工作原理、组成等在我的上一篇转载博客中都有详细介绍，对这方面不太理解的朋友可以去我的上一篇博客看看，博客连接：MHA架构使用原理

简要说明

MHA(Master High Availability)是现在解决mysql高可用的一个相对成熟的方案，它是由两部分组成,管理端(master manager)和节点端(node manager),管理端可以单独布置在一台机器上,整个mysql主从集群就是它的各个节点,管理端对所有节点进行监控,当master宕机之后,管理端会根据自己配置文件里的设定,将某一个从节点升为主节点,(如果没有设置,它会自己比对,将最新数据的节点升为主节点),然后将其他节点自动指向提升上来的新的主节点,在提升的过程中,所有结点之间必须可以无密码ssh连接,管理端可以对所有的节点ssh无密码连接.在MHA自动故障切换的过程中,如果宕掉的 master 无法ssh连接上,则无法同步最新的二进制日志,也就无法获得最新的数据,造成数据丢失,因此,为了避免这中情况发生,MHA一般配合半同步复制.可以最大程度的保存数据。
为了避免在更换主节点时同步日志出错(pos模式下更换节点,日志同步会出错),我们开启GTID模式

实验环境

1：操作系统：rhel6.5
2：节点及其角色
server1：172.25.66.1 master、node-manager
server2：172.25.66.2 slave、node-manager
server3：172.25.66.3 slave、node-manager
server4：172.25.66.4 master-manager

MHA架构下mysql高可用半同步复制的实现

Mysql安装（server1、2、3）

1：安装mysql

tar xf mysql-5.7.17-1.el6.x86_64.rpm-bundle.tar
 yum install -y mysql-community-client-5.7.17-1.el6.x86_64.rpm mysql-community
 -common-5.7.17-1.el6.x86_64.rpm mysql-community-libs-compat-5.7.17-1.el6.x86_64
 .rpm mysql-community-libs-5.7.17-1.el6.x86_64.rpm mysql-community-server-5.7.17-1.el6.x86_64.rpm
 /etc/init.d/mysqld start
 grep "temporary password" /var/log/mysqld.log           ###临时密码 localhost:后面就是密码
 mysql_secure_installation                               ###初始化,密码必须8位数以上,而且大小写字母数字及特殊符号 
密码修改后第一次询问直接回车然后后面全部输入y回车

在这里插入图片描述

在server1、2、3中将这一步做完
2、设置server-id(server1、2、3)

 vim /etc/my.cnf
 server-id=1         server1中是1，server2中是2，server3中是3，每台主机都不能一样，最大2的32次方减1
 log-bin=mysql-bin
 gtid_mode=ON
 enforce-gtid-consistency=true
 
 /etc/init.d/mysqld restart            ###3 台都重启

在这里插入图片描述

配置半同步复制模式

1、在server1、2、3的mysql中授权（每个节点都做）
grant REPLICATION SLAVE on . to repl@‘172.25.66.%’ identified by ‘Guodong+0306’;
show master status;
在这里插入图片描述
2、在server1,2,3启动二个线程(在1中将2，3设置为master，在2中将1，3设置为master，在3中将1，2设置为master),但是在server2、3中最终master都要是server1，可以server1在第二条命令执行

 mysql> change master to master_host='172.25.66.1',master_user='repl',master_password='Guodong+0306',master_auto_position=1;
 mysql> change master to master_host='172.25.66.2',master_user='repl',master_password='Guodong+0306',master_auto_position=1;          
 mysql> start slave;
 mysql> show slave status\G;                ###查询的信息这 2 个为 yes
 Slave_IO_Running: Yes
 Slave_SQL_Running: Yes

在这里插入图片描述
3、安装半同步复制的master插件并开启master（server1、2、3都做）
INSTALL PLUGIN rpl_semi_sync_master SONAME ‘semisync_master.so’;
SET GLOBAL rpl_semi_sync_master_enabled = 1;
show status like ‘Rpl_semi_sync_master_status’;

4、安装半同步复制的slave插件并开启slave（server1、2、3都做）
INSTALL PLUGIN rpl_semi_sync_slave SONAME ‘semisync_slave.so’;
SET GLOBAL rpl_semi_sync_slave_enabled = 1;
STOP SLAVE IO_THREAD;
START SLAVE IO_THREAD;
show status like ‘Rpl_semi_sync_slave_status’;
在这里插入图片描述

各节点之间SSH免密连接

MHA manager 通过 SSH 访问所有的 node 节点,各个 node 节点也同样需要通过 SSH 来相互发送不同的 relay log文件,所以有必要在每一个node和manager上配置SSH无密码登陆。MHAmanager可通过 masterha_check_ssh 脚本检测 SSH 连接是否配置正常。
1、在server4中生成rsa key pair
ssh-keygen
在这里插入图片描述
2、在server4中把公钥和私钥发送给 server1,2,3,如果没有/root/.ssh目录，先创建再发送
scp /root/.ssh/id_rsa /root/.ssh/id_rsa.pub root@172.25.66.1:/root/.ssh/
scp /root/.ssh/id_rsa /root/.ssh/id_rsa.pub root@172.25.66.2:/root/.ssh/
scp /root/.ssh/id_rsa /root/.ssh/id_rsa.pub root@172.25.66.3:/root/.ssh/
在这里插入图片描述
3、在server1、2、3中执行
ssh-copy-id -i /root/.ssh/id_rsa.pub root@自身IP

4、测试免密连接

可见，在四个节点之间用ssh连接不需要密码

安装MHA

安装节点(1,2,3,4 都要安装)

yum install -y mha4mysql-node-0.56-0.el6.noarch.rpm
依赖性—需要安装的包：

 perl-Config-Tiny-2.12-7.1.el6.noarch.rpm
 perl-Email-Date-Format-1.002-5.el6.noarch.rpm
 perl-Log-Dispatch-2.27-1.el6.noarch.rpm
 perl-Mail-Sender-0.8.16-3.el6.noarch.rpm
 perl-Mail-Sendmail-0.79-12.el6.noarch.rpm
 perl-MailTools-2.04-4.el6.noarch.rpm
 perl-MIME-Lite-3.027-2.el6.noarch.rpm
 perl-MIME-Lite-HTML-1.23-2.el6.noarch.rpm
 perl-MIME-Types-1.28-2.el6.noarch.rpm
 perl-Parallel-ForkManager-0.7.9-1.el6.noarch.rpm
 perl-Params-Validate-0.92-3.el6.x86_64.rpm
 perl-TimeDate-1.16-13.el6.noarch.rpm

在这里插入图片描述

安装manager在server4中

1、yum install -y mha4mysql-manager-0.56-0.el6.noarch.rpm
在这里插入图片描述
2、配置MHA-manager节点
创建默认目录及其默认配置文件
mkdir /etc/mha
vim /etc/mha/mha.conf

3、默认配置文件写入如下内容

[server default]
manager_workdir=/usr/local/mha      
#设置manager的工作目录
 
manager_log=/usr/local/mha/mha.log  
#设置manager的日志
 
master_binlog_dir=/var/lib/mysql    
#设置master 保存binlog的位置，以便MHA可以找到master的日志，我这里的也就是mysql的数据目录
 
user=root                   
#设置监控用户root,这个用户在mysql里存在
 
password=Guodong+0306         
#设置mysql中监控用户的那个密码
 
ping_interval=1             
#设置监控主库，发送ping包的时间间隔，默认是3秒，尝试三次没有回应的时候自动进行railover
 
remote_workdir=/tmp         
#设置远端mysql在发生切换时binlog的保存位置
 
repl_user=repl               
#设置同步用户mha
 
repl_password=Guodong+0306     
#设置mha的密码
 
ssh_user=root               
#设置ssh的登录用户名
 
[server1]                 
hostname=172.25.66.1
port=3306
 
[server2]
hostname=172.25.66.2
port=3306
candidate_master=1       
#设置为候选master，如果设置该参数以后，发生主从切换以后将会将此从库提升为主库，即使这个主库不是集群中事件最新的slave
 
check_repl_delay=0       
#默认情况下如果一个slave落后master 100M的relay logs的话，MHA将不会选择该slave作为一个新的master，因为对于这个slave的恢复需要花费很长时间，通过设置check_repl_delay=0,MHA触发切换在选择一个新的master的时候将会忽略复制延时，这个参数对于设置了candidate_master=1的主机非常有用，因为这个候选主在切换的过程中一定是新的master
 
[server3]
hostname=172.25.66.3
port=3306
#no_master=1             #一定不会是master

验证SSH通讯

在server4中：masterha_check_ssh --conf=/etc/mha/mha.conf
在这里插入图片描述

manager节点检测repl环境

masterha_check_repl --conf=/etc/mha/mha.conf
在这里插入图片描述
报错解决
如果报错为：

 [root@server4 ~]# masterha_check_repl --conf=/etc/masterha/app1.cnf
 [error][/usr/share/perl5/vendor_perl/MHA/Server.pm, ln393] server3(172.25.6.4:3306)

解决方案:开启 root 和 repl 用户的权限（1，2，3里面都做）

 mysql> grant all privileges on *.* to 'root'@'%' identified by 'Guodong+0306' with grant option;
 mysql> grant all privileges on *.* to 'repl'@'%' identified by 'Guodong+0306' with grant option;
 mysql> flush privileges;

如果报错为：

Mon Dec 10 20:20:41 2018 - [error][/usr/share/perl5/vendor_perl/MHA/ServerManager.pm, ln781] Multi-master configuration is detected, but two or more masters are either writable (read-only is not set) or dead!

解决方案:slave节点（server2和server3）配置
server2和server3配置relay log的清除方式和slave配置只读，但不要写入配置文件，因为master机down掉后可能随时会升级成master。
set global relay_log_purge=0;
set global read_only=on;
在这里插入图片描述
再次执行masterha_check_repl --conf=/etc/mha/mha.conf