一、Kettle简介
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。kettle的数据抽取主要在于抽取数据,而没有考虑数据库的函数、存储过程、视图、表结构以及索引、约束等等,如果想对这些内容进行迁移,就需要通过写脚本或者更改kettle源码的方式实现了。
二、Kettle下载运行
以下是Kettle的国内镜像下载地址:
http://mirror.bit.edu.cn/pentaho/Data%20Integration/
解压后进入到Kettle目录,双击运行spoon.bat文件,出现如下界面及说明kettle成功部署。
在运行之前,我们需要把对应数据库的jar包导入到Kettle的lib目录下,比如我们需要把oracle迁移到mysql,那就需要oracle和mysql两个jar包:
这个jar包可以直接复制项目里面的,就不用纠结版本问题了。
三、Kettle批量迁移库表
1.新建作业
选择界面上的文件–新建–作业
2.新建数据库连接
由于需要将oracle迁移到mysql,所以我们要分别配置oracle和mysql两个数据库。
配置oracle数据库:
配置mysql数据库:
这里有个坑需要注意一下,就是oracle数据库本身的编码要和mysql的保持一致,同时我们需要在配置mysql连接的“选项”里面配置对应的编码,否则mysql里面导过去的表会出现乱码,且某些表可能会迁移失败造成job异常终止:
3.进行多表迁移
配置完成后,选择“工具=>向导=>复制多表向导”
在弹出框中选择源数据库和目标数据库:
点击“下一步”,在左侧选择需要导入到mysql的库表:
点击“下一步”,输入名字和存储位置:
点击“完成”,会自动生成转换过程:
此时,点击左上角的运行按钮直接执行:
运行结束后,查看执行结果的日志和作业度量是否有报错,没有报错代表迁移成功:
最后需要查看一下mysql数据库库表的数据是否一致,可以使用count语句判断,此外,如果数据库有大量?之类的字符,就要考虑数据库编码选择是否一致且mysql的编码配置是否正确了。
我的公众号 “程序媛永不秃顶” 刚刚开通,关注一波,永不秃顶,哈哈哈哈~