数据清洗(第七章操作题)

一.现有两张数据表,分别为full_source和fulltarget,其中full_source为源数据表,full_target为目标数据表,数据表Full_source和full_target,使用Kettle工具,实现将full_source中的数据全量加载到数据表full_target中。

1.使用Kettle工具创建转换full_load,并添加“执行SQL脚本”控件,“表输入控件",“表输出控件”,以及Hop连接线。
在这里插入图片描述双击执行SQL脚本控件,进入执行SQL语句界面
在这里插入图片描述2.配置数据库
在这里插入图片描述SQL框中编写删除数据表full_target中的数据的SQL语句。
在这里插入图片描述双击表输入控件。
在这里插入图片描述SQL框中编写查询数据表full_source数据的SQL语句,然后单击预览按钮,查看数据表full_source的数据是否成功从MysqL数据库中抽取到表输入流中。
在这里插入图片描述3.配置表输出控件
双击图中的表输出控件,点击目标表处的浏览按钮,选择表输入界面,选择目标表级数据表full_target,这里不需要新的数据库连接,在数据库连接后的下拉列表中选择已创建数据库连接即可。
在SQLyon中输入代码创建表

create table `full_source` (
	`no` int (10),
	`book_name` varchar (60),
	`author` varchar (30),
	`tag` varchar (60)
); 
insert into `full_source` (`no`, `book_name`, `author`, `tag`) values('1','小王子','圣艾克苏佩里','外国文学');
insert into `full_source` (`no`, `book_name`, `author`, `tag`) values('2','解忧杂货店','东野圭吾','小说');
insert into `full_source` (`no`, `book_name`, `author`, `tag`) values('3','白夜行','东野圭吾','小说');
insert into `full_source` (`no`, `book_name`, `author`, `tag`) values('4','梦里花落知多少','郭敬明','小说');
insert into `full_source` (`no`, `book_name`, `author`, `tag`) values('5','看见','柴静','随笔');
insert into `full_source` (`no`, `book_name`, `author`, `tag`) values('6','围城','钱钟书','小说');

在这里插入图片描述在这里插入图片描述在这里插入图片描述

5.运行full_load
在这里插入图片描述5.通过SQLyog工具,查看full_target是否成功加载到数据,查看结果。
在这里插入图片描述

二、现有两张数据表,分别是increasemental_source和incremental_target,其中incremental_source为源数据表,incremental_target为目标数据表。数据表incremental_source和incremental_target的表结构、数据是相同的,通过kettle工具,实现将数据表incremental_source中的数据增量加载到数据表incremental_target中,即将数据表incremental_source中新增、变化的数据加载到数据表incremental_target中。

1.使用Kettle工具创建转换incremental_load,并添加“表输入”控件、“插入/更新”控件,以及Hop跳连接线。
在这里插入图片描述

2.配置“表输出”控件,双击图中“表输出”控件,进入“表输出”界面,单击新建按钮,配置数据库连接,配置完成后点击“确认”按钮。
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述在SQL框中编写查询数据表incremental_source数据的SQL语句,然后单击“预览”按钮,查看数据表incremental_source的数据是否成功从MySQL数据库中抽取到数据流中。
在这里插入图片描述3.双击图中“插入/删除”控件,进入“插入/更新”界面,单击“新建”按钮,单击目标表处的“浏览”按钮,弹出“数据库浏览器”窗口,选择目标表incremental_target,单击“获取字段”按钮,用来指定查询数据需要的关键字,这里比较数据表incremental_target的字段id与输入流里的字段id是否一致为条件,更新数据表中的其他字段数据。
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述单击“获取和更新字段”按钮,用来指定需要更新字段。
在这里插入图片描述

4.修改数据库incremental_source中的数据,在数据表incremental_source中新增一条id为6、name为Mary、age为23的数据;对数据表incremental_source中的id为2的数据进行修改,即将这条数据的年龄(age)改为25。
在这里插入图片描述5.运行转换incremental_load
在这里插入图片描述6.查看数据表incremental_target,打开SQLyog工具,查看数据表incremental_target中是否成功加载到数据。
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值