kettle案例——不一致数据的转换

1.数据准备

通过Kettle工具将对数据表company进行不一致数据的转换操作,即通过与供货商提供的标准价格表进行比较,得出不一致数据,从而进行修改,最终输出到数据表company中。

 2.打开Kettle工具,创建转换

 3.配置表输入控件

单击【新建】按钮,配置数据库连接,配置完成后单击【确认】按钮。MySQL数据库连接的配置,具体如图所示。 

在SQL框中编写查询数据表company中品牌型号不一致数据的 SQL语句,然后单击【预览】按钮,查看数据表company中品牌型号不一致数据是否成功从MySQL数据库中抽取到表输入流中,具体如图所示。 

4.配置表输入2控件

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Kettle(现在通常称为Pentaho Data Integration,简称PDI)是一个开源的数据集成工具,用于数据转换、ETL(提取、转换、加载)任务。在Kettle中进行数据转换主要包括以下几个步骤: 1. **连接源数据**:首先,你需要添加数据源连接器,如JDBC连接器,用于连接数据库或其他数据源。 2. **构建工作流**:创建一个新的Kettle作业或转换,这通常包括一系列步骤,比如输入、转换步骤和输出步骤。 3. **选择转换步骤**: - **抽取**:从数据源读取数据(例如,SELECT查询)。 - **转换**:使用转换步骤对数据进行处理,如合并、过滤、计算、文本处理等。Kettle提供了许多内置的转换操作,如查找、替换、文本分割等。 - **清洗**:清除不必要或错误的数据,确保数据质量。 - **分组/聚合**:如果需要按某些字段进行汇总,可以使用分组或聚合步骤。 - **数据验证**:检查数据是否符合预期格式或规则。 4. **目标数据定义**:为转换后的数据指定输出,可以是数据库、文件、FTP服务器或其他数据存储。 5. **配置参数和变量**:设置步骤间的连接参数,如连接字符串、名等,使用变量管理可以提高复用性和灵活性。 6. **运行和测试**:运行转换并监控其执行,查看日志确保一切按预期工作,必要时调试和优化。 7. **调度和部署**:如果需要定期执行转换,可以设置定时任务或者通过Pentaho Server进行部署。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值