一
首先明确数据分析的五个步骤,分别如下:
提出问题
理解数据
数据清洗
构建模型
数据可视化
A.数据清洗,即对不合格的数据进行筛选,步骤如下
- 缺失值处理,通过查看列的总数据数量进行比较是否缺失,如果发现缺失值,点击开始选项卡中的查找和选项,点击定位条件,选择空值找到缺失值。对其中的一个缺失值处进行填写,ctrl+enter使其他的空格也填入同样的值选择子集,对列进行隐藏和再表示
- 删除重复值
- 列名重命名,直接对列名进行重新命名
- 选择子集,对列进行隐藏和再表示。
接着举例子,这里以上海线上外卖销售情况为例
数据情况如图所示:
该表格中具体记录了GMV、进店人数、下单人数、商家实收等数据
1.备份数据
拿到数据的第一时间,我认为首先要做的事情就是备份数据,右键点击,据此进行源数据的备份
2.查看量级与观测数据准确性
将鼠标放到如图位置,左键点击单元格,则表格右下角显示数据统计情况,据此可以看到具体数据的大小,以制定相符合的分析策略