这里介绍MySQL官方的mysqldbcompare(python写的)和percona公司的pt-table-checksum(perl写的)
mysqldbcompare的作用是
对比两个数据库的表结构、表数据的一致性并能生成对应补偿的SQL,如主备、线上线下
对于差异的展现能通过参数--difftype调控
① unified (default)
② context
③ differ
④ sql
mysqldbcompare
用于比较两个服务器或同个服务器上的数据库,有文件和数据,并生成差异性SQL语句。
要比较数据表,请用另外一个工具:mysqldiff
(点击查看教程)。
以下是mysqldbcompare
的用法。
1 安装
mysqldbcompare
是MySQL Utilities中的一个脚本,默认的MySQL不包含工具集,所以需要独立安装。
- MySQL Utilities下载地址:http://downloads.mysql.com/archives/utilities/。
- Windows系统中需提前安装“Visual C++ Redistributable Packages for Visual Studio 2013”,下载地址:https://www.microsoft.com/en-gb/download/details.aspx?id=40784。
Linux系统在下载页面选择对应发行版。
2 语法
mysqldbcompare
的语法如下:
$ mysqldbcompare --server1=user:pass@host:port:socket --server2=user:pass@host:port:socket db1:db2
以上参数中:
--server1
:MySQL服务器1配置。--server2
:MySQL服务器2配置。如果是同一服务器,--server2
可以省略。db1:db2
:要比较的两个数据库。如果比较不同服务器上的同名数据库,可以省略:db2
。--all
:比较所有两服务器上所有的同名数据库。--exclude
排除无需比较的数据库。--run-all-tests
:运行完整比较,遇到第一次差异时不停止。--changes-for=
:修改对象。例如--changes-for=server2
,那么对比以sever1
为主,生成的差异的修改也是针对server2
的对象的修改。-d DIFFTYPE
,--difftype=DIFFTYPE
:差异的信息显示的方式,有[unified|context|differ|sql]
,默认是unified
。如果使用sql,那么就直接生成差异的SQL,这样非常方便。--show-reverse
:在生成的差异修改里面,同时会包含server2
和server1
的修改。--skip-table-options
:保持表的选项不变,即对比的差异里面不包括表名
、AUTO_INCREMENT
、ENGINE
、CHARSET
等差异。--skip-diff
:跳过对象定义比较检查。所谓对象定义,就是CREATE
语句()
里面的部分,--skip-table-options
是()外面的部分。--skip-object-compare
:默认情况下,先检查两个数据库中相互缺失的对象,再对都存在对象间的差异。这个参数的作用就是,跳过第一步,不检查相互缺失的对象。--skip-checksum-table
:数据一致性验证时跳过CHECKSUM TABLE
。--skip-data-check
:跳过数据一致性验证。--skip-row-count
:跳过字段数量检查。
3 示例
比较两个数据库,并生成差异SQL:
$ mysqldbcompare --server1=root:root@localhost --server2=root:root@localhost db1:db2 --changes-for=server1 -a --difftype=sql
# WARNING: Objects in server1.db1 but not in server1.db2:
# TABLE: table2
#
# WARNING: Objects in server1.db2 but not in server1.tb1:
# TABLE: table3
#
# Defn Row Data
# Type Object Name Diff Count Check
#-------------------------------------------------------------------------
# TABLE t1 pass pass -
# - Compare table checksum FAIL
# - Find row differences FAIL
#
# Transformation for --changes-for=server1:
#
# Data differences found among rows:
UPDATE db1.t1 SET b = ‘Test 123’ WHERE a = ‘1’;
UPDATE db1.t1 SET b = ‘Test 789’ WHERE a = ‘3’;
DELETE FROM db1.t1 WHERE a = ‘4’;
INSERT INTO db1.t1 (a, b) VALUES(‘5’, ‘New row - db2’);
# Database consistency check failed.
#
# …done
WARNING
之后提示两个数据库表之间的差异,也就是一个数据库中有,另一个数据库没有的数据表。
之后就是差异的SQL语句了,把有#
号注释的行删掉,就能直接在数据库中执行了。
说明:执行MySQL语句时可能会遇到这样错误:Error 1054 - Unknown column 'name' in 'aspect'
这是因为
mysqldbcompare
生成的ALTER
语句中,用逗号,
拼装了多条ADD
、CHANGE
等语句,如果这些语句还包含AFTER
关键字,就会提示这个错误并中断执行MySQL语句。解决的办法就是:去除AFTER
及其后面的条件。这可能是MySQL的一个Bug,详情参考:http://bugs.mysql.com/bug.php?id=34972 和 http://bugs.mysql.com/bug.php?id=60650。
参考链接:
« MySQL批量插入数据 MySQL Utilities管理工具介绍 »
在介绍pt-table-checksum之前,先看两组同学的测试
文档有句非常霸气的话:
No matter how large the server is, pt-table-checksum works equally well.
底气就在于Percona将表split成一个个chunk,基于chunk计算crc32值,每次checksum后
都会采集并分析Server的性能信息,并以此来调整chunk大小,避免对线上业务造成冲击
而且这只是其中一个比较耀眼的安全措施,当然文档还解释了很多保护服务器的特性
校验结束后,在每个从库上,执行如下的sql语句即可看到是否有主从不一致发生:
select * from percona.checksums where master_cnt <> this_cnt OR master_crc <> this_crc OR ISNULL(master_crc) <> ISNULL(this_crc) \G
一些限制
① 表要有主键或唯一性索引,否则无法chunk表
② 主备checksum的库和表需要完全相同
③ binlog_format必须是statement模式
重要参数
安全选项:
–check-replication-filters 是否检查复制过滤规则
–check-slave-tables 检查是否所有从库都有被检查的表和列
–chunk-size-limit 每个chunk最大不能超过这个大小,超过就忽略它
限速选项:
–check-interval 多久检查一次主从延迟、主库负载是否达到上限
–check-slave-lag 是否只检查这个从库的延迟
–max-lag 最大延迟,超过这个就等待
–max-load 最大负载,超过这个就等待
过滤选项:
–databases 只检查某些库
–tables 只检查某些表
这些过滤选项在修复不一致数据后,检查修复效果很有用。
其他选项
–resume 因某种原因中断,下次接着执行,不用从头开始
–chunk-time 每个chunk被计算的时间,一般默认为0.5秒
简单范例
# pt-table-checksum --user=root --password=oracle --recursion-method=processlist
参考资料
http://dev.mysql.com/doc/workbench/en/mysqldbcompare.html
http://www.percona.com/doc/percona-toolkit/2.2/pt-table-checksum.html
http://nettedfish.sinaapp.com/blog/2013/06/04/check-replication-consistency-by-pt-table-checksum/
By 迦夜
2013-11-8
Good Luck