Debezium increment snapshot(data recovery)

最新推荐文章于 2024-07-14 22:18:32 发布

qiuqiufangfang1314

最新推荐文章于 2024-07-14 22:18:32 发布

阅读量118

点赞数

文章标签： java 数据库 sql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qiuqiufangfang1314/article/details/130508190

版权

背景

在流式的数据处理中，因为一些原因，导致数据没有输出到下游系统，造成源数据与目标数据不一致，发现不一致后，怎么修复数据？我们是不能够简单直接在目标端修改数据。eg：源端事件流是：

t_s_0: field_a = a

t_s_1: updaet filed_a from a to a1

t_s_2: update filed_a from a1 to a2

在t_s_1与t_s_2间发现数据不一致，我们修复数据，查询到当前数据是 field_a:a1，我们准备sql： update field_a=a1，还未执行sql前，收到t_s_2 事件，目标端数据变成 a2，这时候我们再执行准备的sql，目标端数据变化顺序（a -> a2 -> a1)，这件造成了目标端数据不一致，这主要原因是我们存在两处对目标端数据的并发更新：

a）正常的事件流更新，

b）外部数据修复，read 源数据，再write。

这样并发更新就会很有机会造成数据不一致。既然并发更新会导致数据不一致，那是否可以将并发改成串行？下面我们讨论的 debezium increment snapshot 就可以帮助我们解决这问题。

Debezium increment snapshot原理

在目标源添加一个single table，我们的log监听也会监听这个表的数据变化；
在这个表新增一条记录，告诉debezium 我们需要修复的数据
log capture 接收到single table 事件，事件类型是执行快照，就会先open window（同样会往single table insert 一条数据，事件类型是 open window）；读取需要修复的数据，缓存在窗口中（内存中）；close window（single table insert 一条数据，事件类型是 close window）
在读取修复数据同时debezium还是会收到变更的数据，有可能会修改上一步读取的数据，删除窗口中的脏数据，下发新的数据
收到close window事件，下发窗口剩下的数据。

//TODO

qiuqiufangfang1314

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Debezium increment snapshot(data recovery)

在流式的数据处理中，因为一些原因，导致数据没有输出到下游系统，造成源数据与目标数据不一致，发现不一致后，怎么修复数据？我们是不能够简单直接在目标端修改数据。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。