一、排错思路

 1、一般情况下可能是由于断电主机重启造成slave没有启动
重新启动slave主机的mysql服务,在master主机mysql的shell下刷新查看slave状态,大约需要十秒左右的响应时间
 
 2、重启slave主机mysql服务后仍然报错的情况
发现问题---登录对应master---停止slave-----开启数据表只读锁-----手工同步数据到slave
(取当前状态的master同步数据库覆盖slave的同步数据库)------解锁----重置slave----启动slave

二、排错示例

环境:

 master主机        192.168.100.114
 slave主机机       192.168.100.15
 数据存放目录      /opt/cluster/mysql/var
 mysql安装目录     /opt/cluster/mysql
 mysql配置文件     /etc/my.cnf

 1、发现出现Slave_IO_Running: No  Slave_SQL_Running: No报错

 2、现在登录到master主机的mysql下
[root@localhost bin]# pwd
/opt/cluster/mysql/bin
[root@localhost bin]# ./mysql -uroot -p123456
mysql>USE appdb;
mysql>FLUSH TABLES WITH READ LOCK;
注意:此时不能退出mysql的shell否则数据库的只读锁会自动取消。我们可以在新的窗口dump数据库,
或者直接拷贝数据文件目录,手工同步完成后解锁.
(打开一个新的远程窗口
# cd /opt/cluster/mysql/var
# scp -r appdb/ root@192.168.100.15:/opt/cluster/mysql/var
# 提示输入密码:15机器root用户密码
 开始传输文件,同步备份完成。)
返回刚才添加只读锁的窗口,对数据库表解锁
mysql>UNLOCK TABLES;
mysql>\q

 3、重置slave
登录到slave机器的mysql下  
[root@localhost bin]# pwd
/opt/cluster/mysql/bin
[root@localhost bin]# ./mysql -uroot -p123456
mysql> STOP SLAVE;
mysql> RESET SLAVE;
mysql> CHANGE MASTER TO MASTER_HOST='192.168.100.114(根据实际主机ip改变)', MASTER_PORT=3306, MASTER_USER='jason',
MASTER_PASSWORD='jason', MASTER_LOG_FILE='', MASTER_LOG_POS=4(这里值必须为4,才能初始slave从下一个master的bin值日开始同步);
mysql> START SLVE;
mysql> show master status\G
mysql>\q

 4、回到master主机的mysql下
[root@localhost bin]# pwd
/opt/cluster/mysql/bin
[root@localhost bin]# ./mysql -uroot -p123456
mysql> START SLAVE;
mysql> show master status\G
mysql> show processlist\G
mysql>\q

 5、重启slave主机mysql服务,到maste主机上查看slave状态