《数据清洗》——黑马程序员之第七章数据加载课后作业

本文详细介绍了如何使用Kettle工具进行数据加载,包括全量加载和增量加载的步骤。全量加载涉及清空目标表后再加载源数据,而增量加载则仅加载源数据表中变化的数据。通过实际操作,展示了Kettle在数据预处理中的数据加载功能。
摘要由CSDN通过智能技术生成

  数据的预处理过程,除包括数据抽取、数据本身的清洗与检验以及数据转换操作外·,还包括数据加载操作。数据加载是数据预处理过程的最后一个步骤,主要负责将数据检验、转换后的高质量数据加载到目标数据库中。

7.1 数据的加载机制

  数据的加载机制和数据的抽取机制类似。数据的加载机制主要分为全量加载和增量加载。其中,全量加载是指将目标表数据中的数据全部删除后进行数据加载的操作;而增量加载是指将目标表只加载源数据表中变换的数据,包含新增、修改和删除的数据。

7.1.1 全量加载

  全量加载只需在数据加载之前将目标表数据进行清空,再将源数据表中的数据加载到目标表中

下面是关于全量加载的一个例子,具体实践步骤如下。

1.打开Kettle工具,创建转换

2.执行“配置SQL脚本”配件

MySql数据库连接的配置 

 编写SQL语句

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值