这个问题出现在mysql 5.7之后的版本,主要的原因是mysql会在最新的checkpoint完成后都会在redo log写一个一字节的MLOG_CHECKPOINT 标记,用来标记在此之前的redo都已checkpoint完成。如果处于任何原因没有找到这个标记,那么整个redo日志文件都会被忽略。出现这个错误的话,最好是有备份进行恢复,如果没有做好备份,那按照下面的方法处理可能会有数据丢失。
第一步:设置如下参数,并移除当前使用的redo日志文件:
innodb_log_checksums = ON
这个时候最好也一并设置,避免客户端连接进来操作数据:
skip_networking=ON
然后可以试着启动数据库,如果启动成功的话,可以直接跳到第三步进行备份;如果启动不成功,继续往下。
第二步:如果进入到这一步,通常还会伴随着[ERROR] InnoDB: Page [page id: space=63, page number=165] log sequence number 643331245985 is in the future! Current system log sequence number 643311926814. 这样的错误,这是因为mysql writer线程按照配置的时间间隔以page为单位刷新buffer数据到磁盘,当数据刷新到磁盘的时候,新写入磁盘的page包含了较新的lsn,此时系统system表空间头的lsn并没有同步更新,通常这是检查点线程的工作。在正常的崩溃恢复中,mysql可以借助redo日志来进行前滚和回滚,但是此时redo日志已经被我们删掉了,mysql无法进行恢复操作。此时,只能通过设置
innodb_force_recovery=3
来强制启动mysql。如果仍然启动不成功,则每次对innodb_force_recovery + 1,提高恢复级别再次重启。
第三步:使用mysqldump导出备份:
mysqldump -uroot -p --single-transaction --master-data=2 --flush-privileges --routines --triggers --events --all-databases > fullbackup.sql
在dump的过程中必然会遇到某些表文件损坏导致导出失败的情况,出现这种情况,对于innodb引擎表,可以指定--ignore-table参数跳过有问题的表。对于myisam表,通常可以先行repair,然后再导出。对于其它错误,可以根据提示的错误号,使用--ignore-error参数忽略指定的错误号。
对于有问题的innodb引擎表,在mysqldump导出结束后,可以通过select * from limit size的方式,指定一个小于问题出现时对应的行数,尽可能的恢复数据。
第四步:使用新的备份恢复数据。