数据清洗 - 案例实战 - 上集
学习目标:
一方面学习数据清洗的一个流程;
另一方面通过数据清洗流程加深对Excel软件的熟悉程度.
0. 数据清洗流程
- 选择子集
- 列名重命名
- 缺失数据处理
- 数据类型转换
- 数据排序
- 异常值处理
记住做数据分析一定要备份数据, 因为对于数据操作很多是不可逆的,如果出现错误,防止无法找到原数据.
1. 选择子集
这里主要考察成交件数, 所以将成交金额等其他指标列进行隐藏操作.
2. 列名重命名
同时也可以根据业务背景进行修改列名, 方便后续的分析和操作.
该项目将数据表原来的"内容类型"修改为"渠道类型", 方便后面的分析理解.
3. 缺失数据处理
首先, 查看各列是否存在缺失值.
一个方法就是依次选中每一列, 然后充分利用Excel工具的下边的单元格信息提示,
另一个方法就是使用Excel的数据工具栏.
首先,在Excel表格中选中你想要操作的列名单元格,在这里我选中了G1单元格:引导商详次数,然后点击工具栏的数据,再点击"排序和筛选"模块中的"筛选"功能.