- 博客(1)
- 收藏
- 关注
原创 【数据清洗】数据清洗流程及经验
预处理阶段 预处理阶段主要做两件事情: 一是将数据导入处理工具。 二是看数据。包含两个部分:一是看元数据,包括字段解释、数据来源、代码表等等一切描述数据的信息;二是抽取一部分数据,对数据本身有一个直观的了解,并且初步发现一些问题,为之后的处理做准备。 第一步:缺失值清洗 四个步骤: 1、确定缺失值范围:对每个字段都计算其缺失值比例,然后按照缺失比例和字段重要性,分别制定策略。 2、去除不需要的...
2019-11-01 16:23:10
5778
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人