- 博客(10)
- 收藏
- 关注
原创 《数据清洗》学习笔记
一、数据清洗背景 当今时代,海量数据的来源是广泛的,数据类型也是多而繁多的,因此数据当中也会夹杂着不完整,重复以及错误的数据,如果直接使用这些原始数据,会严重影响数据决策的准确性和效率。因此,对原始数据进行有效的清洗是大数据分析和应用过程中的关键环节。(1)数据质量的评价指标 准确性:对于数据进行降噪处理,通过最常用的异常值检测方法聚类进行处理。 完整性:数据信息是否存在缺失的状况。 简洁性:精良选择重要的本质属性,并消出冗余。...
2021-09-12 15:11:08 1197
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人