加载就是对增量数据进行转换的数据准确的加载到正式库中

最新推荐文章于 2022-11-14 12:05:12 发布

zxcvbaa1

最新推荐文章于 2022-11-14 12:05:12 发布

阅读量226

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43609546/article/details/83794028

版权

一、E---捕获增量

捕获增量有很多种方式，实时触发、时间戳、全量比较和对全量计算，这些方式需要根据不同的需求进行量身定做。

实时触发可以理解为通过触发器的方式在发生变化的时候进行触发，这种方式是最快的方式，但是该种方式建议不使用，因为触发器对数据库的影响非常大。
时间戳是定时通过一个时间戳字段来取增量，或者使用其他自增长字段也可以取代时间戳。
全量比较则是将全量拿来进行比较，该种方式性能会有所影响。比如使用物化视图的方式就是采用了全量比较，但是Oracle的物化视图是经过优化处理的，所以会比较快。
对全量计算就是不找增量，直接将数据全部计算，然后将结果全部加载。
二、T---数据转换

转换过程就是业务的核心。这里有多种情况需要考虑，一般有一对一、一对多和多对一的情况。

一对多有两种情况：一个表的一条记录对应一个表的多条记录，也叫做横转纵（在Kettle中有这样的组件）；一个表的一条记录对应多个表的多条记录。
多对一也有两种情况：一个表的多条记录对应一个表的一条记录，也叫做纵转横（在Kettle中有这样的组件）；多个表的多条记录对应一个表的一条记录。
上面两种情况可以设计不同的方案来处理。

三、L---加载数据

加载就是对增量数据进行转换的数据准确的加载到正式库中。加载到正式环境一般情况有两种方式：一种是Merge，另一种是先delete后Insert。在采用后者时，需要最好使delete和insert操作放到同一个事务中操作。但是可以看到在kettle实现的时候不可能将两个过程在一个事务中存在，所以需要采用其他的方式。后面会涉及到该部分

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
加载就是对增量数据进行转换的数据准确的加载到正式库中

一、E---捕获增量捕获增量有很多种方式，实时触发、时间戳、全量比较和对全量计算，这些方式需要根据不同的需求进行量身定做。实时触发可以理解为通过触发器的方式在发生变化的时候进行触发，这种方式是最快的方式，但是该种方式建议不使用，因为触发器对数据库的影响非常大。时间戳是定时通过一个时间戳字段来取增量，或者使用其他自增长字段也可以取代时间戳。全量比较则是将全量拿来进行比较，该种方式性能会有...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。