演练包括被动切换和主动切换两部分。被动切换是主库宕机,主动切换是人工手动触发。
演练步骤大致如下:
1 先停掉主库,模拟主库宕机
2 mha将vip切到备库,备库变成主库,应用可以正常读写数据库
3 重新启动宕机的原主库
4 在原主库上建立同步关系(根据宕机时,日志记录的binlog的文件名和偏移量,恢复从这里开始)
5 mha手动切换主库,还原到最初状态,应用可以正常读写数据库
6 演练结束
演练过程问题总结:
1 mha每次自动切换之后都会结束自身进程,并在日志目录如/app/mha/xxx/下生成成功或失败标记(sys.failover.complete/error),下一次要启动mha之前要把这些标记文件删除,否则mha无法正常启动,因为有了这些标记文件,mha认为已经切换结束
2 数据库主机切换严谨做法是这个时候要把master设置为只读,然后设置MASTER_LOG_FILE和MASTER_LOG_POS,最后启动复制
3 mha手动切换要指定端口,否则只用ip会被mha认为没有存活
4 数据库主从库要配置/etc/sudoers
Default requiretty 要注释掉(解决"抱歉,您必须拥有一个终端来执行 sudo"的警告)
5 Error happened on monitoring servers
这个问题是没找到mysql映射,添加软连接即可
常用的MHA指令:
1 检查mha的ssh免密登录状态
masterha_check_ssh --conf=/etc/mha/sys/sys.cnf
2 检查mha的运行状态
masterha_check_status --conf=/etc/mha/sys/sys.cnf
3 检查主备库的复制情况
masterha_check_repl --conf=/etc/mha/sys/sys.cnf
4 停止mha
masterha_stop --conf=/etc/mha/sys/sys.cnf
5 启动mha
nohup masterha_manager --conf=/etc/mha/sys/sys.cnf > sys.log 2>&1 &
6 mha手动切换主库
masterha_master_switch --conf=/etc/mha/sys/sys.cnf --master_state=alive --new_master_host=10.138.16.133 --new_master_port=3104 --orig_master_is_new_slave
7 mha重新绑定数据库实例
sudo /etc/mha/sys/master_ip_failover --command=status --ssh_user=xxxadmin --orig_master_host=10.138.16.133 --orig_master_ip=10.138.16.133 --orig_master_port=3104