目录
<1>配置基于gtid的主从复制架构
(https://blog.csdn.net/qq_43109978/article/details/99160673)
mha可同时支持基于日志点和gtid的复制,建议用gtid,因为更加安全,也不会出现重复回放日志的情况
主:192.168.195.139
从:192.168.195.140
从:192.168.195.141
MHA监控服务:192.168.195.140
虚拟ip:192.168.195.100
<2>建立集群的免认证登录
MHA是基于ssh服务的,因为故障转移过程中,保存原主服务器二进制日志,配置虚拟ip地址等操作都需要ssh命令来实现的
#生成密钥
ssh-keygen
#拷贝到其他服务器上
ssh-copy-id -i /root/.ssh/id_rsa '-p 22 root@192.168.195.140'
ssh-copy-id -i /root/.ssh/id_rsa '-p 22 root@192.168.195.141'
注意:本机的ssh免认证也是要配置的,因为每台服务器都可能会成为主
ssh-copy-id -i /root/.ssh/id_rsa '-p 22 root@192.168.195.139'
验证:ssh root@192.168.195.140发现不用密码即可登录
<3>安装MHA-node,MHA-manager及依赖包
MHA-node(集群中所有服务器都要安装),MHA-manager(只需要在监控服务器上)
下载压缩包,并解压
master:https://github.com/yoshinorim/mha4mysql-manager/releases
node:https://github.com/yoshinorim/mha4mysql-node/releases
也可以通过rpm包安装
yum localinstall -y mha4mysql-node-0.58-0.el7.centos.noarch.rpm
yum localinstall -y mha4mysql-manager-0.58-0.el7.centos.noarch.rpm
安装MHA的Perl依赖包
yum -y install perl-Config-Tiny.noarch perl-Time-HiRes.x86_64 perl-Parallel-ForkManager perl-Log-Dispatch-Perl.noarch perl-DBD-MySQL ncftp(监控节点)
yum -y install ncftp perl-DBI.x86 perl-DBD-MySQL(数据节点)
安装node
cd mha4mysql-node-0.58
perl Makefile.PL
make &&make install
报错:Can't locate CPAN.pm
yum -y install perl-CPAN
安装manager
cd mha4mysql-manager-0.58
perl Makefile.PL
make &&make install
<4>配置MHA管理节点
mha只需要在管理节点进行配置
mkdir -p /etc/mha(保存mha的配置文件)
mkdir -p /home/mysql_mha(可能要在失败的主服务器下载二进制日志文件)
设置监控用户
grant all privileges on *.* to mha@"192.168.195.%" identified by "zh179883"
建立配置文件:
vim /etc/mha/mysql_mha.cnf
[server default]
user=mha //要在数据库中建立的,用于mha进行主从管理的数据库用户(监控用户)
password=zh179883 //设监控用户的密码
manager_workdir=/home/mysql_mha //设置管理服务的工作目录
manager_log=/home/mysql_mha/manager.log //设置manager的日志
remote_workdir=/home/mysql_mha //设置远端mysql在发生切换时binlog的保存位置
ssh_user=root //设置ssh的登录用户名
repl_user=zhaoheng //设置复制用户
repl_password=zh179883 //设置复制用户的密码
ping_interval=1 //设置监控主库,发送ping包的时间间隔,默认是3秒,尝试三次没有回应的时候自动进行railover
master_binlog_dir=/var/lib/mysql //MHA去哪里获取master的bin_log,可以通过show variables like "log_bin_basename"获取(只要目录即可)
master_ip_failover_script=/usr/local/bin/master_ip_failover //设置自动failover时候的切换脚本
report_script=/usr/local/send_report //完成主从切换后发送的报警的脚本(邮件)
secondary_check_script=/usr/local/bin/masterha_secondary_check -s 192.168.195.139 -s 192.168.195.141 #实现多路由监测Master的可用性
shutdown_script="" //设置故障发生后关闭故障主机脚本(该脚本的主要作用是关闭主机放在发生脑裂,这里没有使用)
master_ip_online_change_script=/usr/local/bin/master_ip_online_change //设置手动切换时候的切换脚本
[server1]
hostname=192.168.195.139
port=3306
[server2]
hostname=192.168.195.141
port=3306
candidate_master=1 //设置为候选master,如果设置该参数以后,发生主从切换以后将会将此从库提升为主库,即使这个主库不是集群中事件最新的slave
check_repl_delay=0 //默认情况下如果一个slave落后master 100M的relay logs的话,MHA将不会选择该slave作为一个新的master,因为对于这个slave的恢复需要花费很长时间,通过设置check_repl_delay=0,MHA触发切换在选择一个新的master的时候将会忽略复制延时,这个参数对于设置了candidate_master=1的主机非常有用,因为这个候选主在切换的过程中一定是新的master
[server3]
hostname=192.168.195.140
port=3306
no_master=1
故障切换脚本(只需要注意vip,eth2(主服务器的网卡)即可)
#!/bin/env perl
use strict;
use warnings FATAL => 'all';
use Getopt::Long;
my (
$command, $ssh_user, $orig_master_host, $orig_master_ip,
$orig_master_port, $new_master_host, $new_master_ip, $new_master_port
);
my $vip = '192.168.195.100/24'; # Virtual IP
my $gateway = '192.168.195.1'; #Gateway IP
my $interface = 'eth2';
my $key = "1";
my $ssh_start_vip = "/sbin/ifconfig $interface:$key $vip;/sbin/arping -I $interface -c 3 -s $vip $gateway >/dev/null 2>&1";
my $ssh_stop_vip = "/sbin/ifconfig $interface:$key down";
GetOptions(
'command=s' => \$command,
'ssh_user=s' => \$ssh_user,
'orig_master_host=s' => \$orig_master_host,
'orig_master_ip=s' => \$orig_master_ip,
'orig_master_port=i' => \$orig_master_port,
'new_master_host=s' => \$new_master_host,
'new_master_ip=s' => \$new_master_ip,
'new_master_port=i' => \$new_master_port,
);
exit &main();
sub main {
print "\n\nIN SCRIPT TEST====$ssh_stop_vip==$ssh_start_vip===\n\n";
if ( $command eq "stop" || $command eq "stopssh" ) {
#$orig_master_host, $orig_master_ip, $orig_master_port are passed.
# If you manage master ip address at global catalog database,
# invalidate orig_master_ip here.
my $exit_code = 1;
eval {
print "Disabling the VIP on old master: $orig_master_host \n";
&stop_vip();
$exit_code = 0;
};
if ($@) {
warn "Got Error: $@\n";
exit $exit_code;
}
exit $exit_code;
}
elsif ( $command eq "start" ) {
# all arguments are passed.
# If you manage master ip address at global catalog database,
# activate new_master_ip here.
# You can also grant write access (create user, set read_only=0, etc) here.
my $exit_code = 10;
eval {
print "Enabling the VIP - $vip on the new master - $new_master_host \n";
&start_vip();
$exit_code = 0;
};
if ($@) {
warn $@;
exit $exit_code;
}
exit $exit_code;
}
elsif ( $command eq "status" ) {
print "Checking the Status of the script.. OK \n";
`ssh $ssh_user\@$orig_master_host \" $ssh_start_vip \"`;
exit 0;
}
else {
&usage();
exit 1;
}
}
# A simple system call that enable the VIP on the new master
sub start_vip() {
`ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`;
}
# A simple system call that disable the VIP on the old_master
sub stop_vip() {
`ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`;
}
sub usage {
print
"Usage: master_ip_failover --command=start|stop|stopssh|status --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n";
}
<5>检测配置是否正确
masterha_check_ssh(检测ssh免认证的配置是否正确)
masterha_check_ssh --conf=/etc/mha/mysql_mha.cnf
错误1:Socket模块有问题
#若出现各类错误,可到https://blog.51cto.com/arthur376/1812640链接查找原因,安装perl模组http://n.sfs.tw/content/index/10322
masterha_check_repl --conf=/etc/mha/mysql_mha.cnf(检测服务器中集群的复制链路是否正确)
注意:
错误1:这里出现了错误,是因为之前双主复制时没有将139对140的复制关闭,导致139复制140,140也复制139,将139的主从同步删除即可
stop slave;
reset slave;
然后重启mysql
错误2:脚本文件没有执行权限
chmod +x /usr/local/bin/master_ip_failover
<6>启动并测试MHA服务
把他放到后台运行
nohup masterha_manager --conf=/etc/mha/mysql_mha.cnf
nohup masterha_manager --global_conf=/home/tools/mha4mysql-manager-0.58/samples/conf/masterha_default.cnf --conf=/etc/mha/mysql_mha.cnf
报错:sh: /usr/local/bin/masterha_secondary_check: No such file or directory
将secondary_check_script这行暂时取消了
ps -ef 查看进程
<7>设置主服务器虚拟ip
由于mha并不会自动配置主服务器的虚拟ip,我们必须在当前主服务器上配置虚拟ip,之后迁移时,就会把虚拟ip迁移到主服务器上,但在默认主服务器上是不会配置虚拟ip的
ifconfig eth2:1 192.168.195.100/24
<8>测试
将主数据库服务器停掉,发现虚拟ip已经被迁移走了,在141上可以发现,虚拟ip已经到这了,并且,从数据库服务器140的主已经变成141了