kettle开发篇-批量迁移不同数据库数据-Day1

本文介绍了如何使用Kettle工具进行数据库数据的高效迁移。通过Kettle的复制多表向导,可以自动生成建表脚本和数据复制转换,大大简化了手动操作的复杂性和错误率。只需几步,即可实现从SQL Server到Oracle等数据库的数据一键迁移,提高工作效率。
摘要由CSDN通过智能技术生成

开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第2天,点击查看活动详情

前言:

随着企业的发展,和数据库的多种多样,在搭建项目之初,并没有详细考虑到数据库的建设,当增加配置不能满足业务场景需要时,这时候考虑到使用更高性能的数据库,如将sqlserver更换为oracle数据库。或者在搭建新项目时,需要复制原数据库的表结构和数据至其他数据库。怎么快速响应业务要求呢?

第一种方案:在目标库使用SQL语句批量建表,然后去修改字段的类型,主键等等。然后通过应用程序将数据插入至目标库。

第二种方案:自动建表和1:1镜像复制数据,复制数据时支持修改表结构。

在我们没接触到kettle时,一般都会想到第一种方案,这种搬运数据,无疑就像搬砖,非常辛苦,但是效率低下,且出错率高。

1d1e482aa75ab480b9410bbf81b03e4d_B16113203.jpg

有没有高效的搬砖技巧呢?或者有没有更高级的办法,将数据复制粘贴,从一个库迁移至另外一个库呢?

答案当然是肯定的,让我们一起来看看吧。

一、可视化数据迁移程序开发

如下图所示,这是最后完成作业的效果图,对应的作业由两部分组成,一个自动建表的脚步,和一个复制数据的转换,然后通过箭头将类似的转换串联起来,就做成了批次迁移数据的作业。这些作业程序乍看起来有点复杂,像一字长蛇阵,其实这些都不需要我们学习,因为这些都是自动生成的。

image.png

二、kettle开发工具-复制多表向导 如图所示,我们点击工具-向导-复制多表向导,即可进入我们批量数据迁移的可视化开发界面。 (如果没有kettle开发工具,可以点击链接下载,下载低版本的。如5.2的,因为低版本运行更顺畅)

kettle下载地址: https://sourceforge.net/projects/pentaho/files/Data%20Integration/

image.png 如图所示,我们选择生产的源库,迁移至我们数仓的BI库,然后我们点击下一步,选择需要迁移的表,然后点击下一步即可完成迁移数据作业的开发。

image.png

image.png

image.png

三、看看作业程序里面都有啥

1、建表脚本

程序会根据目标库将对应建表语句自动创建,如图所示为oracle建表语句。

image.png

2、复制数据转换

如图所示自动生成转换注释,并生成脚本转换程序,可以看到表输入是查询对应表所有数据,输出至目标库和我们自己写转换程序时一样,只是这是自动生成的,当然我们也可以在里面按自己要求加上过滤条件,来复制我们需要的部分数据,比如我们只需要近一年的数据等等,然后点击运行作业,即可完成数据迁移工作,是不是超级简单呀。 还不赶快去试试吧,有不懂可以留言讨论哦~

image.png

image.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

他们叫我技术总监

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值