一:环境
192.168.1.100 master
192.168.1.101 slave1
192.168.1.102 slave2
 
slave1,slave2都是连在master上。
 
二:模拟主故障
关闭master实例
service MySQL stop
此时,slave1,slave2上show slave status\G都会发现错误:
Last_IO_Error: error reconnecting to master'RepUser@192.168.1.100:3307' - retry-time: 60 retries: 1
 
IO进程和sql进程状态:
Slave_IO_Running: Connecting(该状态表示会一直尝试重连主,如果主正常了,该进程状态会自动变成Yes)
Slave_SQL_Running: Yes
此时,master不能提供读写服务。我们想将其中最新的slave提升为主。

三:切换步骤
3.1确保所有的relay log全部读取完毕
在每个从库上执行:
stopslave io_thread;
showprocesslist;
直到看到Slave has read all relay log; waitingfor more updates,则表示从库更新都执行完毕了
或者通过show slave status查看
Slave_SQL_Running_State: Slave has read allrelay log; waiting for more updates
 
3.2 选择新的主库
对比选择Relay_Master_Log_File,Exec_Master_Log_Pos最大的作为新的主库,这里我们选择slave1为新的主库
其实,如果两个从IO进程一直都是正常,没有落后于主,且relay log都已经重放完成,两个从是一样的,选择哪个都可以。
这里选择slave1作为新主。
 
3.3 进行相应配置
登陆slave1,执行stop slave;
并进入数据库目录,删除master.info和relay-log.info文件(删除前,可以先备份下这俩文件);
配置my.cnf文件,开启log-bin,如果有log-slaves-updates=1和read-only=1则要注释掉,然后重启slave1.
 
3.4 reset master
在slave1上reset master,会重新生成二进制日志。
mysql> reset master;
Query OK, 0 rows affected (0.02 sec)
 
mysql> show binary logs;
+------------------+-----------+
| Log_name         | File_size |
+------------------+-----------+
| mysql-bin.000001 |       154 |
+------------------+-----------+
1 row in set (0.00 sec)
 
3.5创建用于同步的用户
如果slave1完全同步master的话,这步可以省略。
 
3.6 slave2指向slave1

[sql] view plain copy
mysql> change master to master_user='RepUser',master_password='beijing',master_host='192.168.1.101',master_port=3307,master_log_file='mysql-bin.000001',master_log_pos=154;  
Query OK, 0 rows affected, 2 warnings (0.00 sec)  
  
mysql> start slave;  
Query OK, 0 rows affected (0.00 sec)  

 
3.7 将程序写IP改成slave1的IP
程序里之前记录的是master的IP,现在master宕机,故需改IP。