自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 2021-11-15

837838 ​​​​​​​

2021-11-15 17:48:59 363

原创 2021-11-15

8.3.5836

2021-11-15 17:34:31 44

原创 2021-11-05

8.3.28.3.38.3.4

2021-11-05 17:09:45 44

原创 第二章例子

Excel输入:生成记录:预览数据:获取系统信息:排序记录:去除重复值:

2021-11-02 17:45:15 91

原创 第七章操作题

全量加载配置SQL脚本配置表输入配置表输出结果:增量加载配置表输入:配置插入更新:结果:

2021-11-02 16:41:06 51

原创 第六章作业

合并第二题三四、数据的商务规则计算

2021-10-25 19:31:16 46

原创 第五章作业

完全去重配置csv文件设置唯一行(哈希值)补充缺失值配置文本输入过滤记录配置设置要替换的NULL值对于替换完控制进行数据合并

2021-10-25 18:02:17 66

原创 转换与作业

转换作业

2021-10-07 13:47:25 56

原创 第四章课后操作题

转换作业

2021-09-29 11:29:56 178

原创 《数据清洗》学习笔记

一、数据清洗背景 当今时代,海量数据的来源是广泛的,数据类型也是多而繁多的,因此数据当中也会夹杂着不完整,重复以及错误的数据,如果直接使用这些原始数据,会严重影响数据决策的准确性和效率。因此,对原始数据进行有效的清洗是大数据分析和应用过程中的关键环节。(1)数据质量的评价指标 准确性:对于数据进行降噪处理,通过最常用的异常值检测方法聚类进行处理。 完整性:数据信息是否存在缺失的状况。 简洁性:精良选择重要的本质属性,并消出冗余。...

2021-09-12 15:11:08 1082

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除