目录
引言
完全备份是把所有的数据内容进行备份,备份数据中有大量的重复数据,并且完全备份的时间与恢复的时间很长。解决完全备份存在的问题就是使用增量备份的方式,增量备份就是备份自上一次备份之后增加或改变的文件或内容。
一、MySQL 增量备份
1. 增量备份特点
-
增量备份的优点是没有重复数据,备份量不大,时间短;缺点也很明显,需要上次完全备份及完全备份之后所有的增量备份才能恢复,而且对所有增量备份进行逐个反推恢复,操作较为繁锁
-
MySQL 没有提供直接的增量备份方法,但是可以通过 MySQL 的二进制日志(binarylogs) 间接实现增量备份
-
二进制日志对备份的意义如下:
① 二进制日志保存了所有更新或者可能更新数据库的操作
② 二进制日志在启动 MySQL 服务器后开始记录,并在文件达到max_binlog_size 所设置的大小或者接收到 flush logs 命令后重新创建新的日志文件
③ 只需要定时执行 flushlogs 方法重新创建新的日志,生成二进制文件序列,并及时把这些日志保存到安全的地方就完成了一个时间段的增量备份
2. 示例
- ① 开启二进制日志功能
[root@mysql ~]#vim /etc/my.cnf
log-bin=mysql-bin #开启二进制日志文件,以mysql-bin命名
binlog_format = MIXED #指定二进制日志(binlog)的记录格式为 MIXED
[root@mysql ~]#systemctl restart mysqld.service
#查看二进制日志文件
[root@mysql /usr/local/mysql/data]#ls -l /usr/local/mysql/data/mysql-bin.*
-rw-r----- 1 mysql mysql 154 10月 26 14:53 /usr/local/mysql/data/mysql-bin.000001
-rw-r----- 1 mysql mysql 19 10月 26 14:53 /usr/local/mysql/data/mysql-bin.index
二进制日志(binlog)有3种不同的记录格式: STATEMENT (基于SQL语句)、ROW(基于行)、MIXED(混合模式),默认格式是STATEMENT
(1) STATEMENT(基于SQL语句):
每一条涉及到被修改的sql 都会记录在binlog中
缺点:日志量过大,如sleep()函数,last_insert_id()>,以及user-defined fuctions(udf)、主从复制等架构记录日志时会出现问题
总结:增删改查通过sql语句来实现记录,如果用高并发可能会出错,可能时间差异或者延迟,可能不是我们想想的恢复可能你先删除或者在修改,可能会倒过来。准确率低
(2) ROW(基于行)
只记录变动的记录,不记录sql的上下文环境
缺点:如果遇到update…set…where true 那么binlog的数据量会越来越大
总结:update、delete以多行数据起作用,来用行记录下来,只记录变动的记录,不记录sql的上下文环境,比如sql语句记录一行,但是ROW就可能记录10行,但是准确性高,高并发的时候由于操作量,性能变低比较大所以记录都记下来
(3) MIXED 推荐使用一般的语句使用statement,函数使用ROW方式存储。
② 每周选择服务器负载较轻的时间段,或者用户访问较少的时间段进行备份
#对表进行完全备份
mysqldump -uroot -p123123 SCHOOL CLASS01 > /opt/SCHOOL_CLASS01_$(date +%F).sql
#对库进行完全备份
mysqldump -uroot -p123123 --all-databases SCHOOL > /opt/SCHOOL_$(date +%F).sql
#用计划性任务执行
crontab -e
30 1 * * 3 mysqldump -uroot -p123123 SCHOOL CLASS01 > /opt/SCHOOL_CLASS01_$(date +%F).sql
30 1 * * 3 mysqldump -uroot -p123123 --all-databases SCHOOL > /opt/SCHOOL_$(date +%F).sql
#每周三的凌晨 1:30 对数据库和表进行完全备份
③ 可每天进行增量备份操作,生成新的二进制日志文件
ls /usr/local/mysql/data
mysqladmin -uroot -p123456 flush-logs
④ 插入新的数据,以模拟数据的增加或变更
mysql> insert into IT_member values('运维工程师','张三',22,'8','本科',7,20000);
Query OK, 1 row affected (0.01 sec)
mysql> select * from IT_member;
+--------------------+-----------+--------+----------+--------+--------+----------+
| 岗位 | 姓名 | 年龄 | 员工ID | 学历 | 年限 | 薪资 |
+--------------------+-----------+--------+----------+--------+--------+----------+
| 云计算工程师 | 顾磊 | 18 | 1 | 本科 | 6 | 18888.00 |
| 云计算工程师 | 崔配文 | 19 | 2 | 本科 | 7 | 19999.00 |
| 运维工程师 | 张三 | 22 | 8 | 本科 | 7 | 20000.00 |
+--------------------+-----------+--------+----------+--------+--------+----------+
3 rows in set (0.00 sec)
⑤ 生成新的二进制文件并查看其内容
cd /usr/local/mysql/data/
mysqladmin -uroot -p123456 flush-logs
注意:之前的步骤④的数据库操作会保存到mysql-bin.000002文件中,之后我们测试删除库的操作会保存在mysql-bin.000003文件中 (以免当我们基于mysql-bin.000002日志进行恢复时,依然会删除库)
#将记录变更的二进制文件02复制至/opt目录下
cp mysql-bin.000002 /opt/
cd /opt/
#使用64位编码机制去解码,按行读取详细内容
mysqlbinlog --no-defaults --base64-output=decode-rows -v /opt/mysql-bin.000002
二、MySQL 增量恢复
1. 增量恢复的场景
当数据发送错误时,应根据实际情况选择使用完全备份恢复,还是增量备份恢复
增量备份的场景:
① 人为的 SQL 语句破坏了数据库
② 在进行下一次全备之前发送系统故障导致数据库数据丢失
③ 在主从架构中,主库数据发送了故障
根据数据丢失的情况可以分为两类:
① 只丢失了完全备份之后更改的数据
② 完全备份之后丢失所有的数据
2. 丢失完全备份之后更改的数据的恢复
#添加表内容
mysql> insert into gl values ('wangliu',4);
mysql> insert into gl values ('wangw',5);
#截取日志文件
mysqladmin -u root -p123456 flush-logs
[root@mysql /usr/local/mysql/data]#ls #生成03,添加数据的操作保存在02中
mysql-bin.000001 mysql-bin.000002 mysql-bin.000003 ......
#删除插入的两条数据,模拟完全备份后数据丢失的故障
mysql> delete from gl where id=4;
mysql> delete from gl where id=5;
#使用二进制文件进行恢复操作
mysqlbinlog --no-defaults mysql-bin.000002 | mysql -uroot -p
3. 完全备份之后丢失所有数据
#创建新的数据库和数据表
mysql> create database class;
mysql> use class;
mysql> create table gl(name char(8),ID int not null,primary key (ID));
mysql> insert into gl values('zhangsan','1');
......
mysql> insert into gl values('laal','6');
mysql> select * from gl where id;
+----------+----+
| name | ID |
+----------+----+
| zhangsan | 1 |
| wangwu | 2 |
| wangliu | 3 |
| lisi | 4 |
| wb | 5 |
| laal | 6 |
+----------+----+
#完全备份
mysqldump -uroot -p123456 class gl > /opt/class_gl_$(date +%F).sql
#刷新日志
mysqladmin -u root -p flush-logs
#继续在数据库表中添加信息
insert into gl values('ssa',7);
insert into gl values('sa',8);
mysql> select * from gl;
+----------+----+
| name | ID |
+----------+----+
| zhangsan | 1 |
| wangwu | 2 |
| wangliu | 3 |
| lisi | 4 |
| wb | 5 |
| laal | 6 |
| ssa | 7 |
| sa | 8 |
+----------+----+
#删除库class,模拟故障
mysql> drop database class;
#基于000001的全量备份进行还原数据,依次还原000002、000003,并验证结果
mysqlbinlog --no-defaults mysql-bin.000001 | mysql -uroot -p
mysqlbinlog --no-defaults mysql-bin.000002 | mysql -uroot -p
mysqlbinlog --no-defaults mysql-bin.000003 | mysql -uroot -p
4. 基于时间点与位置的恢复
利用二进制日志可实现基于时间点与位置的恢复,例如由于误操作删除了一张表,这时完全恢复是没有用的,因为日志里还有误操作的语句,我们需要的是恢复到误操作之前的状态,然后跳过误操作的语句,再恢复后面操作的语句
4.1 基于时间点的恢复
基于时间点的恢复,就是将某个起始时间的二进制文件导入数据库中,从而跳过某个发生错误的时间点实现数据的恢复
使用 mysqlbinlog 加上–stop-datetime 选项,表示在哪个时间点结束,后面误操作的语句不执行
–start-datetime 选项表示执行后面的语句
结合使用它们就可以跳过误操作的语句,完成恢复工作
需要注意的是,二进制文件中保存的日期格式需要调整为用“-”分割
#恢复用户“lier”的数据
mysql -uroot -p123456 -e "truncate table class.gl;" #清空表数据
mysql -uroot -p123123 -e "select * from class.gl;"
mysqlbinlog --no-defaults --stop-datetime='2021-10-27 0:39:20' mysql-bin.000002 |mysql -uroot -p123456
mysql -uroot -p123456 -e "select * from class.gl;"
4.2 基于位置的恢复
基于位置的恢复,就是使用基于时间点的恢复。可能会出现在一个时间点里既同时存在正确的操作又存在错误的操作,基于位置是一种更为精确的恢复方式。
#使用64位编码机制解码并按行读取二进制文件02(增量备份)的详细内容
mysqlbinlog --no-defaults --base64-output=decode-rows -v mysql-bin.000001
#仅恢复“778”之前的数据,也就是不恢复“lier”的数据
mysql -uroot -p123456 -e "select * from class.gl;"
mysql -uroot -p123456 -e "truncate table class.gl;"
mysql -uroot -p123456 -e "select * from class.gl;"
mysqlbinlog --no-defaults --stop-position='778' mysql-bin.000001 | mysql -uroot -p123456
mysql -uroot -p123456 -e "select * from class.gl;"
#仅恢复“lier”的数据
mysql -uroot -p123456 -e "select * from class.gl;"
mysqlbinlog --no-defaults --start-position='955' mysql-bin.000001 | mysql -uroot -p123456
mysql -uroot -p123456-e "select * from class.gl;"
5. 指定企业备份策略的思路
- 指定企业备份策略要根据企业数据库的实际读写的频繁性与数据的重要性进行
- 数据更新频繁,则应该进行较为频繁的备份
- 数据较为重要,则在有适当更新时进行备份
- 在数据库压力小的时段进行全备,如一周一次,然后每天增备
- 根据公司的规模,中小公司可一天一次全备,大公司可每周一次全备,每天进行一次增备,并且尽量为企业实现主从复制架构
总结
- 使用分割日志的方式进行增量备份
- 增量备份需要根据日志文件的时间先后逐个执行
- 使用基于时间和位置的方式进行恢复可以更精确的恢复数据