![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据清洗
文章平均质量分 67
m0_59775560
这个作者很懒,什么都没留下…
展开
-
数据清洗-黑马程序员_学习笔记(第七章)
一、全量加载介绍:全量加载是指将目标数据表中的数据全部删除后,进行数据加载的操作。目标:通过Kettle工具将数据表full_source中的数据全量加载到数据表full_target中1、打开Kettle工具,创建转换2、配置执行SQL脚本控件...原创 2021-11-05 19:19:28 · 201 阅读 · 0 评论 -
数据清洗—黑马程序员(学习笔记)
1完全去重1.1 打开Kettle工具,创建转换通过使用Kettle工具,创建一个转换repeat_transform,并添加“CSV文件输入”控件、“唯一行(哈希值)”控件以及Hop跳连接线,具体如图所示。图1 创建转换1.2配置CSV文件输入控件1)双击“CSV文件输入”控件,进入“CSV文件输入”界面。图2 csv配置2)单击【浏览】按钮,选择要进行完全去重处理的CSV文件merge.csv;再单击【获取字段】按钮,Kettle会自动检索CSV...原创 2021-10-12 23:10:06 · 198 阅读 · 0 评论 -
数据清洗——黑马程序员(学习笔记)
1抽取CSV文件1.1 打开Kettle工具,创建转换通过使用Kettle工具,创建一个转换csv_extract,并添加“CSV文件输入”控件、“表输出”控件以及Hop跳连接线,具体如图所示。图1 创建转换1.2配置CSV文件输入控件1)双击“CSV文件输入”控件,进入“CSV文件输入”界面。图2 csv配置2)单击【浏览】按钮,选择要抽取的文件csv_extract.csv。图3 选择3)单击【获取字段】按钮,Kettle自动检索CSV文件,.原创 2021-10-07 15:04:16 · 714 阅读 · 0 评论