kettle工具的下载与部署 参考点击打开链接
启动时点击spoon.bat 窗口会一闪而过 耐心等几秒钟,真正的界面会慢慢出来
目前的简单需求就是将cccc库里的基础数据导入到自己库中,但是这些数据只有省份的id,需要与ddd库中的basic表进行连接得到省份名字,所以以下会看到如何在kettle中使用记录集连接
1、在主对象树立新建一个转换 crtl+s输入名字保存(保证中间做变动时可随时保存,前功尽弃是很烦躁的....)
使用中所有的连线都是 按住shift键 拉出一条带箭头的线
2、首先建立所需的DB连接,为防止数据输出时乱码,两个DB连接都要进行编码设置
3、切换到核心对象树里边,选择输入下的表输入,我只截了一个简单表(省份--ddd库)的输入
4、现在基础数据和省的数据都已经输入,进行记录集连接,需要对进行连接的关键字段做排序处理,否则执行时会报错
5、对排序好的数据进行记录集连接
6、若连接出来的数据有未匹配上的需要过滤,则可以选择过滤掉
7、选择表输出,将数据进行映射输出到目标库表中
8、启动测试