分布式概念:数据复制

数据复制是实现数据可靠性的关键方法。对数据进行备份,以提高数据的可用性和可靠性,而实现数据备份的关键技术就是“数据复制技术”。

可以保证存储在不同节点上的同一份数据是一致的。这样当一个节点故障后,可以从其他存储该数据的节点获取数据,避免数据丢失,进而提高了系统的可靠性。

主备数据库
主备数据库中的数据保持一致。

1.比较注重一致性,比如同步复制技术;

当用户请求更新数据时,主数据库必须要同步到备数据库之后才可给用户返回,即如果主数据库没有同步到备数据库,用户的更新操作会一直阻塞。这种方式保证了数据的强一致性,但牺牲了系统的可用性。
示例:读写分离
(1)有两个节点,分别作为主节点和备节点。
(2)两个节点均可接收用户读请求,然后将本节点的数据及时返回给用户。读请求响应快;
(3)如果是写请求,写操作必须由主节点进行,即使用户将写请求发送到备节点,备节点也会将该请求转发给主节点,响应比较慢。
场景:写操作响应慢,会影响用户体验,经常用于分布式数据库主备场景,或对数据一致性有严格要求的场合,比如金融、交易之类的场景。

2.注重可用性,比如异步复制技术;

当用户请求更新数据时,主数据库处理完请求后可直接给用户响应,而不必等待备数据库完成同步。保证了系统的可用性,但牺牲了数据的一致性。
主备数据库同步的流程:
(1)主数据库完成写操作后,可直接给用户回复执行成功,将写操作写入 binary log 中,binary log 中记录着主数据库执行的所有更新操作,以便备数据库获取更新信息。
(2)备数据库启动一个 IO 线程专门读取 binary log 中的内容然后写入 relay log 中。
(3)备数据库启动一个 SQL 线程会定时检查 relay log 里的内容,如发现有新内容则会立即在备数据库中执行,从而实现数据的一致。
场景:购物网站等面向实际用户

3.介于前两者之间的,比如半同步复制技术;

用户发出写请求后,主数据库会执行写操作,并给备数据库发送同步请求,但主数据库不用等待所有备数据库回复数据同步成功便可响应用户。
两种模式:
(1)当主数据库收到多个备数据库中的某一个回复数据同步成功后,便可给用户响应写操作完成;
(2)主数据库等超过一半节点(包括主数据库)回复数据更新成功后,再给用户响应写操作成功;

解决不一致情况
Raft 算法,主数据库等超过一半节点(包括主数据库)回复数据更新成功后,再给用户响应写操作成功。当有 Follower 节点的数据与 Leader 节点数据不一致时,采用强制复制策略来解决不一致情况
当产生冲突时,以 Leader 节点为准。Leader 节点上会对比与自己数据不一致的 Follower 节点所存储的信息,找到两者最后达成一致的地方,然后强制将这个地方之后的数据复制到该 Follower 节点上。


 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值