目录
3.半同步复制(Semi-Sync Replication)
4.增强半同步复制(lossless Semi-Sync Replication、无损复制)
一、主从复制
1.MySQL的复制类型
- STATEMENT:基于语句的复制。在服务器上执行sql语句,在从服务器上执行同样的语句,mysql默认采用基于语句的复制,执行效率高。
- ROW:基于行的复制。把改变的内容复制过去,而不是把命令在从服务器上执行一遍。
- MIXED:混合类型的复制。默认采用基于语句的复制,一旦发现基于语句无法精确复制时,就会采用基于行的复制。
2.mysql主从复制的工作过程
- Master节点将数据的改变记录成二进制日志(Binary log),当Master上的数据发生改变时,则将其改变写入二进制日志中。
- Slave节点会在一定时间间隔内对Master的二进制日志进行探测其是否发生改变,如果发生改变,则开始一个I/O线程请求 Master的二进制事件。
- 同时Master节点为每个I/O线程启动一个dump线程,用于向其发送二进制事件,并保存至Slave节点本地的中继日志(Relay log)中,Slave节点将启动SQL线程从中继日志中读取二进制日志,在本地重放,即解析成 sql 语句逐一执行,使得其数据和 Master节点的保持一致,最后I/O线程和SQL线程将进入睡眠状态,等待下一次被唤醒。
简化
Master将数据保存在二进制日志文件中,I/O thread 向dump thread发出同步请求,dump thread收到请求后将数据发送给I/O thread ,I/O会将数据写入到本地的Relay log中,SQL thread通过读取本地数据的Relay log中的数据,同步到自己的数据库中,至此完成数据同步
注
中继日志通常会位于 OS 缓存中,所以中继日志的开销很小。
复制过程有一个很重要的限制,即复制在 Slave上是串行化的,也就是说 Master上的并行更新操作不能在 Slave上并行操作。
二、mysql四种同步方式
1.异步复制(Async Replication)
默认同步方式是异步复制。主库将更新写入Binlog日志文件后,不需要等待数据更新是否已经复制到从库中,就可以继续处理更多的请求。Master将事件写入binlog,但并不知道Slave是否或何时已经接收且已处理。在异步复制的机制的情况下,如果Master宕机,事务在Master上已提交,但很可能这些事务没有传到任何的Slave上。假设有Master->Salve故障转移的机制,此时Slave也可能会丢失事务。MySQL复制默认是异步复制,异步复制提供了最佳性能。
2.同步复制(Sync Replication)
主库将更新写入Binlog日志文件后,需要等待数据更新已经复制到从库中,并且已经在从库执行成功,然后才能返回继续处理其它的请求。同步复制提供了最佳安全性,保证数据安全,数据不会丢失,但对性能有一定的影响。
3.半同步复制(Semi-Sync Replication)
主库提交更新写入二进制日志文件后,等待数据更新写入了从服务器中继日志中,然后才能再继续处理其它请求。该功能确保至少有1个从库接收完主库传递过来的binlog内容已经写入到自己的relay log里面了,才会通知主库上面的等待线程,该操作完毕。
半同步复制,是最佳安全性与最佳性能之间的一个折中。
MySQL 5.5版本之后引入了半同步复制功能,主从服务器必须安装半同步复制插件,才能开启该复制功能。如果等待超时,超过rpl_semi_sync_master_timeout参数设置时间(默认值为10000,表示10秒),则关闭半同步复制,并自动转换为异步复制模式。当master dump线程发送完一个事务的所有事件之后,如果在rpl_semi_sync_master_timeout内,收到了从库的响应,则主从又重新恢复为增强半同步复制。
ACK (Acknowledge character)即是确认字符。
4.增强半同步复制(lossless Semi-Sync Replication、无损复制)
增强半同步是在MySQL 5.7引入,其实半同步可以看成是一个过渡功能,因为默认的配置就是增强半同步,所以,大家一般说的半同步复制其实就是增强的半同步复制,也就是无损复制。
增强半同步和半同步不同的是,等待ACK时间不同
rpl_semi_sync_master_wait_point = AFTER_SYNC(默认)
半同步的问题是因为等待ACK的点是Commit之后,此时Master已经完成数据变更,用户已经可以看到最新数据,当Binlog还未同步到Slave时,发生主从切换,那么此时从库是没有这个最新数据的,用户看到的是老数据。
增强半同步将等待ACK的点放在提交Commit之前,此时数据还未被提交,外界看不到数据变更,此时如果发送主从切换,新库依然还是老数据,不存在数据不一致的问题。
5.主从复制的优点
- 数据备份(Data Backup):只是简单的对数据库进行备份,降低数据丢失的风险,
- 线下统计:用于报表等对数据时效性要求不高的场合;
- 负载均衡(Load Balance)、读写分离:主要用在MySQL集群,解决单点故障或做故障切换;以降低单台服务器的负载和风险,如实现读写分离,可以使得服务器访问负荷比较均衡。
- 数据分发(Data DistributIOn)、灾备:主要用于多数据中心或异地备份,实现数据分发与同步。
- 高可用和数据容错(High Availability and Failover):MySQL自带的健康监控和检测,根据配置的时间间隔,可以检测主库是否正常工作,一旦发现主库宕机或无法正常工作,就会选择到最好的一个备库上。
三、主从复制高延迟
1.原因
- master 服务器高并发,形成大量事务
- 网络延迟
- 主从硬件设备导致(cpu 主频、内存 io、硬盘 io)
- 本来就不是同步复制、而是异步复制
2.解决方案
- 从库优化 Mysql 参数。比如增大 innodb_buffer_pool_size,让更多操作在 mysql 内存中完成,减少磁盘操作
- 从库使用高性能主机(高性能 cpu、大内存),避免使用虚拟云主机,使用物理主机,提升 I/O 吞吐量
- 从库使用 SSD 磁盘
- 网络优化,避免跨机房实现同步
四、实验:主从复制
1.Master服务器
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
systemctl status firewalld
yum -y install ntp
vim /etc/ntp.conf
#--末尾添加--
server 127.127.169.0
#设置本地是时钟源,注意修改自己的网段
fudge 127.127.169.0 stratum 8
#设置时间层级为 8(限制在 15 内)
systemctl start ntpd
systemctl status ntpd
2.Slave1服务器
yum -y install ntp ntpdate
systemctl start ntpd
systemctl status ntpd
/usr/sbin/ntpdate 192.168.169.201
#进行时间同步
crontab -e
*/30 * * * * /usr/sbin/ntpdate 192.168.169.201
3.Slave2服务器
yum -y install ntp ntpdate
systemctl start ntpd.service
systemctl status ntpd.service
/usr/sbin/ntpdate 192.168.169.201
#进行时间同步
crontab -e
*/30 * * * * /usr/sbin/ntpdate 192.168.169.201
4.主服务器配置
vim /etc/my.cnf
server-id = 1
log-bin=master-bin
#添加,主服务器开启二进制日志
log-slave-updates=true
#添加,允许从服务器更新二进制日志
binlog_format = MIXED
systemctl restart mysqld
mysql -u root -p
GRANT REPLICATION SLAVE ON *.* TO 'myslave'@'192.168.169.%'
IDENTIFIED BY '654321';
#给从服务器授权
FLUSH PRIVILEGES;
show master status;
#File 列显示日志名,Fosition 列显示偏移量
5.从服务器配置
5.1Slave1
vim /etc/my.cnf
server-id = 2
#修改,注意id与Master的不同,两个Slave的id也要不同
relay-log=relay-log-bin
#添加,开启中继日志,从主服务器上同步日志文件记录到本地
relay-log-index=slave-relay-bin.index
#添加,定义中继日志文件的位置和名称
relay_log_recovery = 1
#选配项
#当 slave 从库宕机后,假如 relay-log 损坏了,
导致一部分中继日志没有处理,则自动放弃所有未执
行的 relay-log,并且重新从 master 上获取日志,
这样就保证了relay-log 的完整性。默认情况下该
功能是关闭的,将 relay_log_recovery 的值设置
为 1 时, 可在 slave 从库上开启该功能,建议开启。
systemctl restart mysqld
mysql -uroot -p654321
change master to master_host='192.168.169.201' ,
master_user='myslave',master_password='654321',
master_log_file='master-bin.000003',master_log_pos=604;
#配置同步,注意 master_log_file 和 master_log_pos
的值要与Master查询的一致,这里的是例子,每个人的都不一样
start slave;
#启动同步,如有报错执行 reset slave;
show slave status\G
#查看 Slave 状态
//确保 IO 和 SQL 线程都是 Yes,代表同步正常。
Slave_IO_Running: Yes
#负责与主机的io通信
Slave_SQL_Running: Yes
#负责自己的slave mysql进程
5.2slave2
vim /etc/my.cnf
server-id = 3
#修改,注意id与Master的不同,两个Slave的id也要不同
relay-log=relay-log-bin
#添加,开启中继日志,从主服务器上同步日志文件记录到本地
relay-log-index=slave-relay-bin.index
#添加,定义中继日志文件的位置和名称
relay_log_recovery = 1
#选配项
#当 slave 从库宕机后,假如 relay-log 损坏了,
导致一部分中继日志没有处理,则自动放弃所有未执
行的 relay-log,并且重新从 master 上获取日志,
这样就保证了relay-log 的完整性。默认情况下该
功能是关闭的,将 relay_log_recovery 的值设置
为 1 时, 可在 slave 从库上开启该功能,建议开启。
systemctl restart mysqld
mysql -uroot -p654321
change master to master_host='192.168.169.201' ,
master_user='myslave',master_password='654321',
master_log_file='master-bin.000003',master_log_pos=604;
#配置同步,注意 master_log_file 和 master_log_pos
的值要与Master查询的一致,这里的是例子,每个人的都不一样
start slave;
#启动同步,如有报错执行 reset slave;
show slave status\G
#查看 Slave 状态
//确保 IO 和 SQL 线程都是 Yes,代表同步正常。
Slave_IO_Running: Yes
#负责与主机的io通信
Slave_SQL_Running: Yes
#负责自己的slave mysql进程
6.验证主从复制效果
在Master上创建一个新的数据库,然后去Slave上查看是否进行同步复制。