ETL - 实战 Kettle 第一讲

本文介绍了使用PDI(Kettle)进行数据ETL操作的实战,首先通过作业和转换的方式迁移客户表数据,确保订单表能引用到客户ID。详细讲述了如何创建转换,设置表输出步骤,连接MySQL数据库,编写SQL查询,以及步骤间的连接。完成了第一步转换后,预告了接下来将处理订单表的关联数据迁移。
摘要由CSDN通过智能技术生成

前(fei)言(hua)

PDI 主要有两个部件,一个是转换,另一个是作业,他们之间不同的是作业是同步的,即每一步骤都要等待前一步骤完成,而转换是所有步骤异步运行。
在这里插入图片描述
对于我们的实战项目,要先将数据迁移填充至新客户表,因为订单表需要客户表的主键id作为它的外键,所以我们首先需要一个作业和两个转换,作业将会一个一个执行转换,第一个转换是迁移客户表数据,第二个则是将订单表拆分,和客户表关联。

  1. 让我们创建一个新的转换,并填充旧的客户数据。点击文件→新建→转换。
  2. 打开左面板的核心对象,搜索表输出,拖放至右面板,然后双击这个新的步骤,会弹出一个步骤配置弹窗:
    在这里插入图片描述
  3. 可以给这个步骤命名:获取唯一的客户数据,然后点击新建数据库连接:
    在这里插入图片描述
  4. 填写连接名称,选择MySQL作为连接类型,并填写服务器主机、端口、用户、密码和数据库吗,然后单击按钮
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值