kettle做数据迁移及kettle迁移效率优化

最新推荐文章于 2024-05-24 15:33:45 发布

许静羽

最新推荐文章于 2024-05-24 15:33:45 发布

阅读量4.6k

点赞数 6

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mrxuliang/article/details/82493587

版权

前段时间做一个大数据平台项目,项目中期的时候需要把客户的HANA库中的数据迁移到我们的数据库,Oracle做中间库,当时借鉴了一些前辈的意见,初步方案是全量迁移用kettle,增量迁移用Java job,后来随着kettle的研究深入,发现了kettle的效率很高,随即全都用了kettle,介绍一下我都使用心得.

我下的版本比较高

启动的话,点击Spoon.bat,Windows启动就行,Linux的话Spoon.sh

kettle有两种流程,一个是转换,一个是作业,可以配置多个转换在一个作业中定时去跑,也可以多个job互相嵌套,kettle的用处很多,又因为是纯Java开发,所以只需要配置好JDK环境就行了,配置转换和作业之前,我们先进行一些基本设置.由于我涉及的迁移是大数据,单表近7千万的所以我对kettle的迁移效率做了一些优化.

1.增大JVM

2.使用连接池

3.网络配置

useCompression=true
rewriteBatchedStatements=true
useServerPrepStmts=false

4.设置表输出每次commit为30000

5.使用多线程

6.配置集群(全量迁移时使用,增量没必要)

7.并行迁移多张表

真正定时执行的Job是这个

这是全量迁移,增量迁移组件如图

目前实现了全量一次迁移,增量每日执行,增量业务场景为 update insert delete 保持了,源库和目标库的数据一致性,完整性.

关注

6
点赞
踩
25

收藏

觉得还不错? 一键收藏
0
评论
kettle做数据迁移及kettle迁移效率优化

前段时间做一个大数据平台项目,项目中期的时候需要把客户的HANA库中的数据迁移到我们的数据库,Oracle做中间库,当时借鉴了一些前辈的意见,初步方案是全量迁移用kettle,增量迁移用Java job,后来随着kettle的研究深入,发现了kettle的效率很高,随即全都用了kettle,介绍一下我都使用心得.我下的版本比较高启动的话,点击Spoon.bat,Windows启动就行,...
复制链接

扫一扫

许静羽 CSDN认证博客专家 CSDN认证企业博客

码龄6年

1: 原创

66万+: 周排名

48万+: 总排名

1万+: 访问

: 等级

184: 积分

1: 粉丝

20: 获赞

6: 评论

34: 收藏

私信

关注

热门文章

最新评论

为什么现在流行resultful,webservice无人问津?
哈哈gogo: 最多也就是老项目还在维护，这种占用更多，过时的东西，为什么还要用，
为什么现在流行resultful,webservice无人问津?
shisan3775: 博主了解webservice 发展历史，和配套的应用环境发展历史，可以更新一篇文章么？
为什么现在流行resultful,webservice无人问津?
q77102902: 用int 分，就完事了，说这些。
为什么现在流行resultful,webservice无人问津?
simleShine: 用字符串传递就好了，后台分析的时候用bigdecimal转一下，主要是post get 太方便了，随手拿起来想要啥传啥，后台解析的时候类型想转就转，只需要联调的时候跟人家商量好就行，用xml太费劲了，一般政府项目和银行项目的严谨接口才会用这种玩意，短平快的项目谁用谁累死
为什么现在流行resultful,webservice无人问津?
不为往事扰，余生只爱笑。: 实际中，我觉得你未必能接触到钱的项目，再说，如果接触到，不也是BigDecimal之类的吗，你这问的好没有水平，完全不搭啊。

大家在看

最新文章

为什么现在流行resultful,webservice无人问津?

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。