MySQL中有6种日志文件,分别是:重做日志(redo log)、回滚日志(undo log)、二进制日志(binlog)、错误日志(error log)、慢查询日志(slow query log)、一般查询日志(general log),中继日志(relay log)。
其中重做日志和回滚日志与事务操作息息相关,二进制日志也与事务操作有一定的关系,这三种日志,对理解MySQL中的事务操作有着重要的意义。
重做日志(redo log)
作用:
确保事务的持久性。
防止在发生故障的时间点,尚有脏页未写入磁盘,在重启mysql服务的时候,根据redo log进行重做,从而达到事务的持久性。
例子:例如,当一个修改数据记录的操作发生时,此时先需要从磁盘把数据页读入到一个缓存池中,在这个缓存池中进行修改,那么这个时候就会有缓存池中的数据和磁盘数据页中的数据不一致,称缓存池中的数据为脏数据,此时如果发生意外(如数据库服务重启),此时缓存池中的数据还没有刷新到磁盘(同步到磁盘是个随机IO),此时就会发生数据丢失,如果此时可以有一个文件,当缓存池中的数据发生变化的时候,可以把相应修改记录记录到这个文件(记录日志是顺序IO),那么当发生服务器重启的时候,就可以根据这个文件记录的内容,重新应用磁盘文件,以保持数据的一致。而redo log就是来干这个事的。
内容:
物理格式的日志,记录的是物理数据页面的修改的信息,其redo log是顺序写入redo log file的物理文件中去的。
什么时候产生:
事务开始之后就产生redo log,redo log的写入并不是随着事务的提交才写入的,而是在事务的执行过程中,便开始写入redo log文件中。
什么时候释放:
当对应事务的脏页写入到磁盘之后,redo log的使命也就完成了,重做日志占用的空间就可以重用(被覆盖)。
对应的物理文件:
默认情况下,对应的物理文件位于数据库的data目录下的ib_logfile1&ib_logfile2 innodb_log_group_home_dir指定日志文件组所在的路径,默认./,表示在数据库的数据目录下。
innodb_log_files_in_group指定重做日志文件组中的文件的数量,默认2
关于文件的大小和数量,由下面两个参数配置
innodb_log_file_size 重做日志文件的大小
innodb_mirrored_log_groups 指定了日志镜像文件组的数量,默认1
其他:
最重要的一点,redo log是事务开始之后逐步写入磁盘的,之所以说重做日志是在事务开始之后逐步写入重做日志文件,而不一定是事务提交才写入重做日志缓存,原因就是,重做日志有一个缓存区Innodb_log_buffer,Innodb_log_buffer的默认大小为8M(可以自己设置),Innodb存储引擎先将重做日志写入innodb_log_buffer中。
然后会通过以下三种方式将innodb日志缓存区的日志刷新到磁盘
1. Master Thread 每秒一次执行刷新Innodb_log_buffer到重做日志文件。
2. 每个事务提交时会将重做日志刷新到重做日志文件。
3. 当重做日志缓存可用空间少于一半时,重做日志缓存被刷新到重做日志文件,由此可以看出,重做日志通过不止一种方式写入磁盘,尤其是对于第一种方式,Innodb_log_buffer到重做日志文件是Master Thread线程的定时任务。
因此重做日志的写入,并一定是随着事务的提交才写入重做日志文件的,而是随着事务的开始,逐步开始的。
即使某个事物还没有提交,Innodb存储引擎仍然每秒会将重做日志缓存刷新到重做日志文件。这可以很好的解释再大的事务的提交的时间也是很短暂的。
回滚日志(undo log)
作用:
保存了事务发生之前的数据的一个版本,可以用于回滚,同时可以提供多版本并发控制下的读(MVCC),也即非锁定读。
内容:
逻辑格式的日志,在执行undo的时候,仅仅是将数据从逻辑上恢复至事务之前的状态,而不是从物理页面上操作实现的,这一点是不同于redo log的。
什么时候产生:
事务开始之前,将当前的版本生成undo log,undo也会产生redo来保证undo log的可靠性
什么时候释放:
当事务提交之后,undo log并不能立马被删除,而是放入待清理的链表,由清理线程判断是否有其他事务在使用undo段中表的上一个事务之前的版本信息,决定是否可以清理undo log 的日志空间。
对应的物理文件:
MySQL 5.6之前,undo表空间位于共享表空间的回滚段中,共享表空间的默认的名称是ibdata,位于数据文件目录中。MySQL 5.6之后,undo 表空间可以配置成独立的文件,但是提前需要在配置文件中配置,完成数据库初始化后生效且不可改变undo log文件的个数,如果初始化数据库之前没有进行相关配置,那么就无法配置成独立的表空间了。
如果undo 使用的共享表空间,这个共享表空间中又不仅仅是存储了undo的信息,共享表空间默认为在MySQL的数据目录下面,其属性由参数innodb_data_file_path配置。
其他:
undo是在事务开始之前保存的被修改数据的一个版本,产生undo日志的时候,同样会伴随类似于保护事务持久化机制的redo log的产生。
默认情况下,undo文件是保持在共享表空间的也即ibdatafile文件中,当数据库中发生一些大的事务性操作的时候,要生成大量的undo信息,全部保存在共享表空间中的。
因此共享表空间可能会变的很大,默认情况下,也就是undo日志使用共享表空间的时候,被“撑大”的共享表空间是不会也不能自动收缩的。
因此,mysql 5.7之后的“独立undo表空间”的配置就显得很有必要了。
二进制日志(bin log):
作用:
1. 用于复制,在主从复制中,从库利用主库上的binlog进行重播,实现主从同步。
2. 用于数据库的基于时间点的还原。
内容:
逻辑格式的日志,可以简单认为就是执行过的事务中的sql语句。
但又不完全是sql 语句这么简单,而是包括了执行的sql语句(增删改)反向的信息,也就意味着delete对应着delete本身和其反向的insert;update对应着update执行前后的版本信息;insert对应着delete和insert本身的信息。
因此可以基于binlog做到类似于oracle的闪回功能,其实都是依赖于binlog中的日志记录。
什么时候产生:
事务提交的时候,一次性将事务中的sql语句(一个事务可能对应多个sql语句)按照一定的格式记录到binlog中。这里与redo log很明显的差异就是redo log并不一定是在事务提交的时候刷新到磁盘,redo log是在事务开始之后就开始逐步写入磁盘。
因此对于事务的提交,即便是较大的事务,提交都是很快的,但是在开启了bin_log的情况下,对于较大的事务的提交,可能会变得比较慢一些。这是因为binlog是在事务提交的时候一次性写入造成的。
什么时候释放:
binlog的默认保持时间参数是expire_logs_days配置,也就是说对于非活动的日志文件,在生成时间超过expire_logs_days配置的天数后,会被自动删除。默认值为0,既不会自动删除,也就是一直存在,不会过期。
对应的物理文件:
配置文件的路径为log_bin_basename,binlog日志文件按照指定大小,当日志文件达到指定的最大的大小之后,进行滚动更新,生成新的日志文件。对于每个binlog日志文件,通过一个统一的index文件来组织。下面是没有开启binlog日志的结果。
其他:
二进制日志的作用之一是还原数据库的,这与redo log很类似,但两者有本质的不同:
1. 作用不同:redo log是保证事务的持久性的,是事务层面的,binlog作为还原的还能,是数据库层面的(也可以精确到事务层面的),虽然都有还原的意思,但是其保护数据的层次是不一样的。
2. 内容不同Lredo log是物理日志,是数据页面的修改之后的物理记录,binlog是逻辑日志,可以简单认为记录的就是sql语句。
3. 另外,两者日志产生的时间,可以释放的时间,在可释放的情况下清理机制,都是完全不同的。
4. 恢复数据时候的效率,基于物理日志的redo log恢复数据的效率要高于语句逻辑日志的binlog。
关于事务的提交,redo log和binlog的写入顺序,为了保证主从复制时候的主从一致(当然也包括使用binlog进行基于时间点还原的情况),是要严格一致的,MySQL通过两阶段提交过程来完成事务的一致性的,也即redo log和binlog的一致性的,理论上是先写redo log,再写binlog,两个日志都提交成功(刷入磁盘),事务才算真正完成。
扩展:
MYSQL必须先执行语句才能确定他是否真的修改了数据,因此他会在语句执行完毕之后才把有关的信息写入二进制日志,而不是在刚接收到他们的时候就写入。
服务器往二进制日志里写入信息的格式不是文本,而是一种更有效率的二进制格式,这意味着这种类型的日志无法直接阅读,可以使用工具程序mysqlbinlog查看。
MYSQL服务器会按各个事件执行完毕的顺序把他们写入二进制日志,而不是以接收到他们的顺序写入。对于那些包含在事务里的语句,服务器会将他们缓存起来,一直到该事务被成功提交,然后,他才会把在次期间发生的所有事件写入日志。如果事务被回滚,则这个事务不会被写到二进制日志,因为他没有让数据库产生任何变化。
实际上,更为确切的说法是,回滚事务通常都不会被写入二进制日志。