kettle分批处理大表数据_Kettle:Oracle多表格批量同步数据=》mysql

Oracle

多表格批量同步数据=》MYSQL

场景

多张Oracle表格,通过轮询自动同步数据到mysql。

避免每个Oracle表格数据=》mysql都做一个转换,产生大量转换,难以管理和调整。

主要通过kettle变量,循环,字段名自动匹配,以及Oracle、mysql数据字典来实现。

初步完成Oracle表格=》mysql的初始化同步,后续增加增量同步,DDL同步,异常处理操作。

基本步骤

1.

在mysql里查找test库下有哪些表格,输出到结果记录

2.

从结果记录里面每次取一行,设置变量

3.

针对每次使用的变量值,去oracle数据源里生成对应的表输入(通过变量生成)

4.

把变量赋给表输出组件的表名

5.

表输出其他内容不做制定,因为表名和字段都和源端oracle是一样的

6.

针对每个“输出到结果记录”做循环,插入每个oracle表格数据到mysql

总体流程

步骤1:Tables in mysql(Job)

步骤2:insert into mysql(Job)

步骤2.1 set tablename(tranfomation)

步骤2.2:insert data into mysql(tranfomation)

后续问题:

l

如何做增量的数据迁移

1.

针对oracle这端有时间字段的表格

2.

记录每次迁移的系统时间

3.

增量时间是》上次系统时间 and 《本次系统时间

每张表格时间字段名字可能不一样

所以要维护一张表格时间字段记录(表名,时间字段名)

4.

每次生成表输入时,也参照生成表名变量的方式,获取时间字段名,用在表输入的sql里

5.

表输出这端,会复杂一些,包括删除、插入、更新等等操作

l

无时间字段或流水号的表格同步

l

如何做DDL同步:

1.

获取Oracle和mysql的数据字典

2.

比较表名和字段名

3.

比较字段数据类型

4.

注意数据类型映射(如oracle的varchar2《=》MySQL的varchar,oracle的data《=》MySQL的timestamp)

5.

Mysql端的表格和字段同步

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值