- 博客(3)
- 收藏
- 关注
转载 数据清洗
解决数据质量问题解决数据的各种问题,包括但不限于: 数据的完整性----例如人的属性中缺少性别、籍贯、年龄等 数据的唯一性----例如不同来源的数据出现重复的情况 数据的权威性----例如同一个指标出现多个来源的数据,且数值不一样 数据的合法性----例如获取的数据与常识不符,年龄大于150岁 数据的一致性----例如不同来源的不同指标,实际内涵是一样的,或是同一指标内涵不一致 数据清洗的结果是对各种脏数据进行对应方式的处理,得到标准的、干净的、连续的数据,提供给数据统计、数据
2020-06-24 10:44:13 221
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人