mysql 主从服务-主从复制数据一致性校验

20 篇文章 0 订阅

在理想情况下,备库和主库的数据应该是完全一样的。但事实上备库可能发生错误并导致数据不一致。即使没有明显的错误,备库同样可能因为 MySQL 自身的特性导致数据不一致,例如 MySQL 的Bug感、网络中断、服务器宕机等,非正常关闭或者其他一些错误。

按照我们的经验来看,主备一致应该是一种规范,而不是例外,也就是说,检查你的主备库一致性应该是一个日常工作,特别是当使用备库来做备份时尤为重要,因为肯定不希望从一个已经损坏的备库里获得备份数据。

我们可以使用 percona-toolkit 工具做校验,而该工具包含:

  1. pt-table-checksum 负责检测 MySQL 主从数据一致性。
  2. pt-table-sync 负责挡住从数据不一致时修复数据,让他们保存数据的一致性。
  3. pt-heartbeat 负责监控 MySQL 主从同步延迟。

在主库安装:

工具可以下载可以看这个文章:https://blog.csdn.net/qq_39408664/article/details/119378696


# 安装插件
[root@localhost src]# yum install perl-IO-Socket-SSL perl-DBD-MySQL perl-Time-HiRes perl perl-DBI -y

# 安装本地工具
[root@localhost src]# yum -y localinstall percona-toolkit-3.2.1-1.el7.x86_64.rpm

# 查看列表
[root@localhost src]# yum list | grep percona-toolkit
percona-toolkit.x86_64                      3.2.1-1.el7                installed

# 查看帮助
[root@localhost src]# pt-table-checksum --help

使用方法:


pt-table-checksum [options] [dsn]

pt-table-checksum:在主(Master)上通过执行校验的查询对复制的一致性进行检查,对比主从的校验值,从而产生结果。DSN指向的是主的地址,该工具的退出状态不为零,如果发现有任何差别,或者如果出现任何警告或错误,更多信息请查看官方资料。

现在我们可以准备一个动作:来模拟数据不一致的问题,同时需要确保主从是配置好了的 -》思路就是创建一个test的库随便添加一个表:


# 创建库
create database `mytest`;

# 创建表
create table user (
id int(10) primary key,
name varchar(20)
);


首先在主库新增数据:


# 进入数据库
mysql> use mytest;

# 写入几条数据
mysql> insert into user (id,name)values(1,'xiaoming');
mysql> insert into user (id,name)values(2,'php');
mysql> insert into user (id,name)values(3,'java');
mysql> insert into user (id,name)values(4,'python');

# 查询一下
mysql> select * from user;
+----+----------+
| id | name     |
+----+----------+
|  1 | xiaoming |
|  2 | php      |
|  3 | java     |
|  4 | python   |
+----+----------+
4 rows in set (0.00 sec)

其次是在从库操作;此时因为主从复制的原因,在上面主库进行的操作都会被复制到从库。


# 进入数据库
mysql> use mytest;

# 写入一条数据
mysql> insert into user (id,name)values(5,'html');

# 查询数据
mysql> select * from user;
+----+----------+
| id | name     |
+----+----------+
|  1 | xiaoming |
|  2 | php      |
|  3 | java     |
|  4 | python   |
|  5 | html     |
+----+----------+
5 rows in set (0.00 sec)

从上面可以看到实际上数据是不同步的,也就是主库的数据少于从库的数据。



使用工具检测

注意常用的参数解释:

--nocheck-replication-filters:不检查复制过滤器,建议启用。后面可以用–databases来指定需要检查的数据库。
--no-check-binlog-format: 不检查复制的binlog模式,要是binlog模式是ROW,则会报错。
--replicate-check-only:只显示不同步的信息。
--replicate=:把checksum的信息写入到指定表中,建议直接写到被检查的数据库当中。
--databases=:指定需要被检查的数据库,多个则用逗号隔开。
--tables=:指定需要被检查的表,多个用逗号隔开
--host | h=:Master的地址
--user | u=:用户名
--password | p=:密码
--Post | P=:端口


检测

在检测中遇到问题请看这个文章(包含了大部分问题讲解):https://blog.csdn.net/qq_39408664/article/details/119445937


# 执行检测命令
#--replicate=check_data.checksums 这个是错误写入的表,不用手动创建,执行命令后自动创建的,可以修改
#--user  --password  主库从库需要一致

[root@localhost ~]# pt-table-checksum --nocheck-replication-filters --no-check-binlog-format --replicate=check_data.checksums --databases=mytest --tables=user --user=mytest_slave --password=root
Checking if all tables can be checksummed ...
Starting checksum ...
            TS ERRORS  DIFFS     ROWS  DIFF_ROWS  CHUNKS SKIPPED    TIME TABLE
08-06T10:30:32      0      1        8          0       1       0   0.037 mytest.user

# 显示这样即代表没有问题运行成功了。

# Checking if all tables can be checksummed ...  代表开始检测校验表和库
# Starting checksum ...  代表开始校验信息
# TS 代表完成检查的时间
# ERRORS  检查时候发生错误和警告的数量
# DIFFS  0代表数据一致 1表示不一致;当指定--no-replicate-check时,会一直为0,当指定--replicate-check-only会显示不同的信息。
# ROWS  表的行数
# CHUNKS  被划分到表中的块的数目
# SKIPPED  由于错误或警告过大,则跳过块的数目
# TIME  执行时间
# TABLE  被检查的表名

哪些信息数据会记录在 checksums 表中


mysql> use check_data;

mysql> show tables;
+----------------------+
| Tables_in_check_data |
+----------------------+
| checksums            |
+----------------------+
1 row in set (0.00 sec)

# 查看信息
mysql> select * from checksums \G;
*************************** 1. row ***************************
            db: mytest
           tbl: user
         chunk: 1
    chunk_time: 0.002004
   chunk_index: NULL
lower_boundary: NULL
upper_boundary: NULL
      this_crc: 30058a09
      this_cnt: 8
    master_crc: 30058a09
    master_cnt: 8
            ts: 2021-08-06 10:52:35
1 row in set (0.00 sec)

ERROR: 
No query specified




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: mysql主从复制可以通过以下几种方式来保持数据一致性: 1. 在主库上开启 binlog,从库上开启 relay log,通过 binlog 和 relay log 来同步数据。 2. 在主库上开启 GTID,从库上也开启 GTID,通过 GTID 来同步数据。 3. 在主库上开启半同步复制,从库上开启半同步复制,通过半同步复制来保证数据一致性。 4. 在主库和从库上都开启并行复制,通过并行复制来加快数据同步的速度。 以上几种方式都可以保证数据一致性,具体选择哪种方式需要根据实际情况来决定。 ### 回答2: MySQL主从复制是一种数据同步的机制,数据一致性是保证主库和从库之间数据完全一致的关键要素。 首先,MySQL使用二进制日志(binary log)记录主库上发生的所有操作,并将这些操作传递给从库进行重放。这确保了主库和从库拥有相同的数据集。 其次,MySQL主从复制通过复制事件(replication event)对数据进行同步。在主库上执行的每个数据库操作都被记录为一个事件,并按照顺序传递给从库进行执行。这样,不论是数据的插入、更新还是删除操作,从库都能按照相同的顺序和方式执行,保持数据一致性。 此外,MySQL主从复制采用基于事务的方式进行数据复制。主库上执行的每个事务都会被记录为一个复制事件,并且这些事务在从库上以相同的顺序和方式执行,从而确保数据一致性。 在主从复制中,还存在一个重要的因素是延迟(lag)。由于网络、硬件等原因,从库上执行复制事件可能会有一定的延迟。为了保持数据一致性,需要通过设置参数和监控机制,确保从库上的延迟不会影响主库和从库之间的数据一致性。 同时,为了避免主库的故障导致数据丢失,MySQL提供了半同步复制(semi-synchronous replication)机制。通过将事务在主库上的提交确认同步到至少一个从库后再返回给客户端,确保了主库上的数据改变已经有效地被至少一个从库接收,从而提高了数据一致性和可靠性。 综上所述,MySQL主从复制通过二进制日志记录、复制事件同步、基于事务的复制和延迟监控,以及半同步复制等机制,保证了数据在主库和从库之间的一致性。 ### 回答3: MySQL主从复制是一种常用的数据复制方案,用于同步将一个数据库的变更应用到其他多个数据库上。为了保持数据一致性MySQL主从复制采用了以下几个机制: 1. 二进制日志(Binary Log):主服务器将所有的数据更新操作(如插入、更新、删除等)记录在二进制日志中,并定期将其发送给从服务器。从服务器通过读取主服务器的二进制日志,将这些操作逐一应用到自己的数据库中。这保证了数据的变更在从服务器上按照相同的顺序被执行。 2. GTID(Global Transaction Identifier):GTID是一个全局事务标识符,用于跟踪主服务器上的每个事务操作。主服务器在每个事务的开始和结束时生成一个GTID,并发送给从服务器。从服务器通过比较主服务器和自己的GTID来判断是否已经应用了相应的事务操作,以避免重复应用。 3. 复制线程和日志解析器:MySQL服务器通过启动一个复制线程(I/O Thread)与主服务器建立连接,并通过日志解析器(SQL Thread)解析并执行主服务器发来的二进制日志。这两个线程协同工作,确保数据的变更被正确地复制到从服务器。 4. 延迟监控和错误检测:MySQL主从复制提供了延迟监控功能,可以检测从服务器与主服务器之间的延迟情况。如果发生网络故障或其他错误,复制过程可能会中断或延迟,MySQL会自动检测并尝试重新连接。同时,还可以通过配置参数来设置复制过程的超时时间,确保数据同步的正常性和一致性。 综上所述,MySQL主从复制通过二进制日志、GTID、复制线程和日志解析器、延迟监控和错误检测等机制来保持数据一致性。这些机制确保了主服务器上的数据变更能够同步地应用到从服务器上,从而达到数据一致性和可靠性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值