实验环境
rhel6.5.x86_64bit selinux关闭,防火墙关闭
server1:172.25.5.1 mha-manager
server2:172.25.5.2 master mysql-5.7.19 mha-node
server3:172.25.5.3 master slave mysql-5.7.19 mha-node
server4:172.25.5.4 master slave mysql-5.7.19 mha-node
首先配置数据库集群
写配置
vim /etc/my.cnf
[mysqld]
datadir=/var/lib/mysql
socket=/var/lib/mysql/mysql.sock
user=mysql
#Disabling symbolic-links is recommended to prevent assorted security risks
symbolic-links=0
server-id=1#server2为2,server3为3
gtid_mode=ON
enforce_gtid_consistency=ON
master_info_repository=TABLE
relay_log_info_repository=TABLE
#binlog_checksum=NONE
log_slave_updates=ON
log_bin=binlog
binlog_format=ROW
binlog-do-db=lockey
binlog-ignore-db=mysql
[mysqld_safe]
log-error=/var/log/mysqld.log
pid-file=/var/run/mysqld/mysqld.pid
如果前面做过其他的实验需要清理数据库目录
rm -rf /var/lib/mysql/*
/etc/init.d/init.d/mysqld stop
/etc/init.d/init.d/mysqld start
三台数据库服务器都做好初始化,初始密码可以在日志中过滤
# cat /var/log/mysqld.log | grep password
然后的分别登陆三台服务器做好初始化工作
# mysql -p
Enter password:
mysql> alter user root@localhost identified by 'Lockey+123';
Query OK, 0 rows affected (0.02 sec)
mysql> grant replication slave on *.* to ha@'172.25.5.%' identified by 'Lockey+123';
Query OK, 0 rows affected, 1 warning (0.00 sec)
接下来就需要在2台master-slave服务器上分别操作了
mysql> change master to master_host='172.25.5.2',master_user='ha',master_password='Lockey+123',master_auto_position=1;
Query OK, 0 rows affected, 2 warnings (0.07 sec)
mysql> start slave;
Query OK, 0 rows affected (0.01 sec)
mysql> show slave status\G;
。。。
Relay_Master_Log_File: binlog.000002
Slave_IO_Running: Yes###yes表示成功
Slave_SQL_Running: Yes###yes表示成功
。。。
配置数据库manager(一般都会有依赖的,所以yum源要全,要不然就得自己去下载一些依赖包)
server1:172.25.5.1
mha4mysql-manager-0.56-0.el6.noarch.rpm
mha4mysql-node-0.56-0.el6.noarch.rpm
perl-Config-Tiny-2.12-7.1.el6.noarch.rpm
perl-Email-Date-Format-1.002-5.el6.noarch.rpm
perl-Log-Dispatch-2.27-1.el6.noarch.rpm
perl-Mail-Sender-0.8.16-3.el6.noarch.rpm
perl-Mail-Sendmail-0.79-12.el6.noarch.rpm
perl-MIME-Lite-3.027-2.el6.noarch.rpm
perl-MIME-Types-1.28-2.el6.noarch.rpm
perl-Parallel-ForkManager-0.7.9-1.el6.noarch.rpm
yum install * -y
配置文件
# cat /etc/masterha/app.cnf
[server default]
manager_workdir=/etc/masterha
manager_log=/etc/masterha/mha.log
master_binlog_dir=/var/lib/mysql
#master_ip_failover_script=/etc/masterha/master_ip_failover
#master_ip_online_change_script= /etc/masterha/master_ip_online_change
password=Lockey+123
user=root
ping_interval=1
remote_workdir=/tmp
repl_password=Lockey+123
repl_user=ha
#report_script=/usr/local/send_report
#secondary_check_script=/usr/bin/masterha_secondary_check -s 172.25.5.4 -s 172.25.5.5
#shutdown_script=""
ssh_user=root
[server1]
hostname=172.25.5.2
port=3306
#candidate_master=1
#check_repl_delay=0
[server2]
hostname=172.25.5.3
port=3306
candidate_master=1
check_repl_delay=0
[server3]
hostname=172.25.5.4
port=3306
#no_master=1
需要使得各服务器能够互相免密通过ssh登陆
在manager上
ssh-keygen 一路回车
ssh-copy-id 172.25.5.2
ssh-copy-id 172.25.5.3
ssh-copy-id 172.25.5.4
scp ~/.ssh/id_rsa -p root@172.25.5.2:~/.ssh/
scp ~/.ssh/id_rsa -p root@172.25.5.3:~/.ssh/
scp ~/.ssh/id_rsa -p root@172.25.5.4:~/.ssh/
做完以上步骤之后需要验证是否能够免密连接否则下一步会有问题
测试
masterha_check_ssh --conf=/etc/masterha/app.cnf
最后一行结果:Fri Sep 29 22:57:49 2017 - [info] All SSH connection tests passed successfully.
如果有error请检查个服务器之间的ssh免密登陆
各服务器需要安装节点软件,然后进行数据库授权(因为是主从,所以只需要在master上操作即可)
mysql> grant all on *.* to root@'172.25.5.%' identified by 'Lockey+123';
masterha_check_repl --conf=/etc/masterha/app.cnf
最后一行结果:MySQL Replication Health is OK.
如果有error请检查数据库授权、防火墙、selinux
接下来进行故障切换,在线切换,手动切换测试
在线虚拟ip切换
这个时候我们就需要修改manager的配置文件了,把注释掉的两行取消注释,并且把脚本也拷贝到指定的位置去
master_ip_failover_script=/etc/masterha/master_ip_failover
master_ip_online_change_script= /etc/masterha/master_ip_online_change
切换之前的状态
172.25.5.2 master vip 172.25.5.99
172.25.5.3 slave
172.25.5.4 slave
在manager(172.25.5.1,server1)上操作
#masterha_check_status --conf=/etc/masterha/app.cnf
NOT-RUNNING
#nohup masterha_manager --conf=/etc/masterha/app.cnf &
masterha_check_status --conf=/etc/masterha/app.cnf
RUNNING
然后制造故障,将master的mysql kill掉
172.25.5.2
kill -9 pid pid
这个时候再去看的话发现vip漂移到了172.25.5.3,并且成为了新的master,可以通过show master status查看状态
这时候再去172.25.5.4(server4)上通过命令:show slave status\G;可以看到他的master变成了172.25.5.3(server3)。
手动在线切换
切换之前的状态:master为server3,slave为server2和server4
[root@lockey1 masterha]# masterha_master_switch --conf=/etc/masterha/app.cnf --master_state=alive --new_master_host=172.25.5.2 --new_master_port=3306 --orig_master_is_new_slave --running_updates_limit=10000
查看172.25.5.2发现vip漂移过来了,并且它成为了master,slave设置被断掉了,然后再去Server3和Server4上查看slave信息发现它的master变成了172.25.5.2;
手动故障切换
切换之前的状态:master为server2,slave为server3和server4
将master上的mysql kill掉之后执行以下命令
[root@lockey1 masterha]# masterha_master_switch –conf=/etc/masterha/app.cnf –master_state=dead –dead_master_host=172.25.5.2 –dead_master_post=3306 –new_master_host=172.25.5.3 –new_master_port=3306
查看172.25.5.3发现vip漂移过来了,并且它成为了master,slave设置被断掉了,然后再去Server4上查看slave信息发现它的master变成了172.25.5.3;然后我们将172.25.5.2的mysql服务启动起来并加入slave
mysql> change master to master_host='172.25.5.3',master_user='ha',master_password='Lockey+123',master_auto_position=1;
mysql> start slave;
Query OK, 0 rows affected (0.01 sec)
mysql> show slave status\G;
*************************** 1. row ***************************
Slave_IO_State: Waiting for master to send event
Master_Host: 172.25.5.3######
Master_User: ha
Master_Port: 3306
Connect_Retry: 60
Master_Log_File: binlog.000003
Read_Master_Log_Pos: 523
Relay_Log_File: lockey2-relay-bin.000002
Relay_Log_Pos: 405
Relay_Master_Log_File: binlog.000003
Slave_IO_Running: Yes######
Slave_SQL_Running: Yes######