一 概念
1 MTS(Prepared transactions slave parallel applier)
主库在同一时间进入prepare状态的事务可以被从库并行回放
2 传统与改进
mariadb 从库回放处理(Commit-Parent-Based模式) 一组事务全部执行完才会执行下一组事务,时间:所有一组事务并行执行的总和 问题 一旦一组事务其中一个为大事务,那么整组事务的执行时间会被拖延,导致并行复制下的延时,拖累回放进度
mysql5.7 从库回放处理(Lock-Based模式) 一组事务其中一个事务执行完,那么后续事务只要cq小于等于上一组事务最小seq号(代表不会有锁冲突),就可以继续执行,这样加快了执行的效率
3 线程
模型:生产者 Coordinator
消费者模型 Worker
4 并行复制须知
1 普通复制也支持并行复制,但是还是提倡采用GTID复制
2 并行复制并不能完全避免大事务和DDL产生的延时问题,只能尽量缓解,不能解决无主键和myisam表的问题,只能靠DBA来解决
3 并行复制所要实现的目标是完全按照主库情况回放,这里要注意,主库如果串行,那么从库也一定是串行.
这里存在的一种情况就是在业务不繁忙的情况下,DBA或者研发进行删除数据或者执行DDL操作,这样的并行复制情况下一定会有延时
4 并行复制进程可能存在单个线程应用错误,但是IO and sql thread 为YES的情况
5 监控
健康监控 IO_THREAD,SQL_THREAD Seconds_Behind_Master
replication_applier_status_by_worker 查看worker的消费并行读
6 参数
1 slave_pending_jobs_size_max
说明 如果event大小已经超过了等待任务大小的上限(配置slave-pending-jobs-size-max ),就报event太大的错,然后返回
调优 在多线程复制时,在队列中Pending的事件所占用的最大内存,默认为16M,如果内存富余,或者延迟较大时,可以适当调大;注意这个值要比主库的max_allowed_packet大,主要针对大事务
2 slave-parallel-type=LOGICAL_CLOCK //事务级别复制
3 slave-parallel-workers=16 //消费者线程
4 relay_log_recovery=ON //保证relay-log的完整性
5 master_info_repository=TABLE
relay_log_info_repository=TABLE //复制信息记录
6 slave_preserve_commit_order
1 目的 并行应用relay-log,但是顺序提交,防止数据紊乱(这里理解的应该是同一时间事务组的顺序提交)-> 5.7.19的版本后才会真正采用.
2 注意
1 MGR必须开启此参数 2 设置此参数从库必须开启中继日志 切记 3 此参数可能导致从库出现延迟问题,可以打开关闭进行延迟问题测评决定是否开启,因为要有多余的代码和IO操作,会加重成本