开源Kettle 瓶颈—灵蜂ETL产品 BeeDI 解决

最新推荐文章于 2024-04-29 23:47:34 发布

码字先生

最新推荐文章于 2024-04-29 23:47:34 发布

阅读量169

点赞数

文章标签：数据库大数据

原文链接：https://blog.csdn.net/little_bee_2004/article/details/118095350?spm=1001.2014.3001.5501

版权

在实际业务中，在直接使用开源Kettle 和包装开源Kettle功能遇见硬核功能瓶颈，灵蜂ETL产品 BeeDI 来解决！详见下表：

序号	技术参数	BeeDI	Kettle
1	整库迁移或批量表导出	批量自动映射源表结构到目标库。	手工逐一定义MAP完成表映射。
2	时间戳同步	要求源表包含时间戳字段,每次同步时,根据上次记录的断点读取未同步的数据,同步结束后记录断点。所有逻辑全部自动完成,无需手工扩展。	要求目标表包含和源表一样的时间戳字段,每次同步时通过MAX()函数获取目标表已经同步数据的最大时间戳,然后在源表设置过滤条件读取上次同步后产生的记录,需要手工编辑SQL处理上述逻辑。
3	触发器同步	软件自动在源库创建触发器和临时表，数据同步后，自动删除临时表中的数据。	用户自己手工创建触发器及临时表,每当源表中的数据发生变化，就被相应的触发器将变化的数据写入临时表，抽取线程从临时表中抽取数据后需要手工删除临时表数据。
4	日志实时同步	软件解析源库日志，还原其中的DML操作并在目标库顺序执行	~~不支持~~
5	全表比对	分为是否进行差异更新，差异更新时，通过计算每条记录的效验码，对源表和目标表记录进行比对，目标表记录不存在则插入，目标表记录不相同则更新，目标表包含源表没有的记录则删除。非差异更新时，读取检查源表记录是否存在于目标表，不存在则插入，存在则更新目标表。	将每一条数据的每列内容进行比对，比对完了以后追加一个状态字段用来描述这条数据的状态，共有四种状态：identical（未改变）、changed（改变）、new（新增）、deleted（删除），所对应的操作就是增、删、改，接下来借助kettle的switch/case组件按照操作类型执行不同的操作了。
6	任务调度	包含作业调度和工作流调度，统一管理任务的运行。	软件自身定时调度功能不稳定,需要在系统计划中部署任务。

序号	技术参数	BeeDI	Kettle
7	定制开发	内置集成脚本开发环境，所有图形配置均可转为脚本执行，脚本支持逐行断点调试。	使用Java Script脚本或定义java class。
8	数据一致性校验	比较源表于目标表数据一致性。	~~不支持~~
9	数据血缘分析	对集成环境涉及的任意表进行追溯，识别指定数据表从产生到最终使用途径的各个系统及对应的处理过程。	~~不支持~~
10	数据分析	查看任意数据库、文件或Hadoop数据分布情况，对数据进行量化分析，提供记录总数、算术和、平均值、最大值、最小值、方差及标准差指标分析。	~~不支持~~
11	CSV文件导入Oracle性能	15:30:02 开始 15:30:53 结束 300万数据51秒	15:32:24 开始 15:35:35 结束 300万数据3分11秒

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
开源Kettle 瓶颈—灵蜂ETL产品 BeeDI 解决

在实际业务中，在直接使用开源Kettle 和包装开源Kettle功能遇见硬核功能瓶颈，灵蜂ETL产品 BeeDI 来解决！详见下表：序号技术参数 BeeDI Kettle 1 整库迁移或批量表导出批量自动映射源表结构到目标库。手工逐一定义MAP完成表映射。 2 时间戳同步要求源表包含时间戳字段,每次同步时,根据上次记录的断点读取未同步的数据,同步结束后记录断点。所有逻...
复制链接

扫一扫

码字先生 CSDN认证博客专家 CSDN认证企业博客

码龄4年

1: 原创

170万+: 周排名

22万+: 总排名

1万+: 访问

: 等级

77: 积分

1: 粉丝

2: 获赞

5: 评论

14: 收藏

私信

关注

热门文章

最新评论

异构数据库同步方案
CSDN-Ada助手: 推荐 MySQL入门技能树：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
异构数据库同步方案
CSDN-Ada助手: 推荐 MySQL入门技能树：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
常见ETL工具一览，你知多少？
ETLCloud数据集成社区: 感谢博主推荐，我们企业最近新出了ETLCloud数据集成工具，提供大量数据集成和转换功能，支持多种数据源的连接和转换操作，，欢迎博主去体验下，也可以加入我们的社区，一起交流下，提提不同的建议！！
ETL工具精髓功能实时数据同步
码字先生: 很有见解，转载了。
ETL工具精髓功能实时数据同步
不吃西红柿丶: 大佬写得很棒，忍不住就是一个赞，欢迎回赞哦~

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。