复制之所以工作得益于MySQL把对数据库的变更都记录在binlog中,然后主库把它读出来,放到从库上去应用。当然binlog的用途不仅限于此,比如PITR等
在5.1.4版本以前,binlog格式只能是statement -based replication ,在以后的版本中引入了row-based replication 以及mixed-based replication。
下面我会简单的介绍一下SBR、RBR、MBR这三种格式下binlog是如何组织的,更重要的是在这三种格式下,replication是如何进行工作的。当然我主要介绍RBR模式下的复制,因为RBR模式下我们的复制是认为是最安全的方式,即使是使用MBR也会有可能踩到坑。
在MySQL中,Binlog有两类文件,一类文件用于记录数据变更,一类文件用于记录binloglist。
Binloglist文件就是${HOSTNAME}-bin.index ;用于记录当前有哪些binlog
binlog的数据文件名字类似于${HOSTNAME}-bin.00001,这类文件是我们重点关注的对象。
先来大概的看看binlog的文件内容:
svan-mac:mydata xiean$ mysqlbinlog -vvvv mysql-bin.000010
/*!50530 SET @@SESSION.PSEUDO_SLAVE_MODE=1*/;
/*!50003 SET @OLD_COMPLETION_TYPE=@@COMPLETION_TYPE,COMPLETION_TYPE=0*/;
DELIMITER /*!*/;
# at 4
#151218 15:19:30 server id 5331 end_log_pos 123 CRC32 0xd483743a Start: binlog v 4, server v 5.7.9-log created 151218 15:19:30
# Warning: this binlog is either in use or was not closed properly.
BINLOG '
grNzVg/TFAAAdwAAAHsAAAABAAQANS43LjktbG9nAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAAAAAAEzgNAAgAEgAEBAQEEgAAXwAEGggAAAAICAgCAAAACgoKKioAEjQA
ATp0g9Q=
'/*!*/;
# at 123
#151218 15:19:30 server id 5331 end_log_pos 154 CRC32 0x622c3733 Previous-GTIDs
# [empty]
SET @@SESSION.GTID_NEXT= 'AUTOMATIC' /* added by mysqlbinlog */ /*!*/;
DELIMITER ;
# End of log file
/*!50003 SET COMPLETION_TYPE=@OLD_COMPLETION_TYPE*/;
/*!50530 SET @@SESSION.PSEUDO_SLAVE_MODE=0*/;
抽一段binlog出来看看:
# at 141
#151218 15:19:30server id 5331 end_log_pos 245
Query thread_id=3350 exec_time=11 error_code=0
at 141
当前事件在文件中的起始位置,单位bytes
#151218 15:19:30
当前事件开始时间
Serverid
当前事件在哪个Server执行的
End_log_pos
下一个事件在文件中的开始位置,即当前事件内容为4~end_log_pos-1范围
exec_time
执行所花费的时间(如果是Master);
error_code
执行该事件时的结果
我们把Binlog文件拆分成3个部份
简单描述-->
{
"header": "desc …",
"event": "xxxxxxx",
"footer": "log rotat"
}
第一部份:由4-bytes开始,这4-bytes表明它是一个MySQLbinlog文件(由log_event.h 这个文件常量:BINLOG_MAGIC (0xfe 0x62 0x69 0x6e = 0xfe 'b''i''n') 表示),这也就能解释我们的第一个event为什么起始位置是4 了原因了。
第二部份:一个一个的event,每个event根据binlog版本不同,解释出来的含义有所不同(在MySQL5.0+binlog版本都使用的是V4版本)
第三部份:也就是文件最后event用于记录log-rotation 事件,表明了接下来的日志将写入哪个文件。
Event是binlog记录的最小单位,event的上一级是eventgroup,复制或者恢复的时候基于eventgroup来重放日志。对于一个组来说,要么都执行,要么都不执行。而对于DML来说一个event包含多个event,而对于DDL来说,一个event就是一个eventgroup。对于每个Event里边有哪些东西,以及eventgroup是如何划分的我们将在下面讨论。
触发器,存储过程,函数在MySQL里边是如何处理的呢?
触发器,存储过程,函数在创建的时候都会记录Binlog
触发器在执行的时候Master、Slave都会被调用,Master上的触发器将会在Master上被调用,Slave上的触发器将会在Slave上被调用。
存储过程在执行的时候,Master上会被转化成具体的SQL语句存储在Binlog里边,因此在binlog里边是看不到任何call来调用存储过程的event。
函数在执行的时候并不会被解析成为具体的语句,相反函数执行时和触发器比较相像,在Master上和Slave都会被调用。
三种模式下Binlog是如何记录的
基于语句的复制:是MySQL5.7.7 版本以前默认配置,它将SQL语句(而不是实际的数据变化)从主服务器复制到从服务器。
优点:在某些情况下,最终写入日志文件的数据更少,例如更新或者删除许多行时。对于只影响几行数据的简单语句,基于行的复制占用的空间更少。
缺点:最明显的是它不支持不确定性的语句,例如当前时间函数。
基于行的复制:使用单个的表行记录变化,而不是语句。主服务器将消息,也就是事件写入二进制日志,表示单个表行的变化。这与其他RDBMS中更加传统的复制方式类似。
优点:需要更少的锁定,意味着能够达到更高的并发。
缺点:它会产生更多需要记录的数据,占用的空间大。
混合模式日志:可以根据要记录的事件实时改变二进制日志格式。使用混合模式复制时,默认采用基于语句的复制,但是在某些情况下自动切换到基于行的复制
PPT下载地址:http://pan.baidu.com/s/1mgZrvLI