数据可视化步骤
1.从数据出发
2.你想通过图表展现什么
3.选择什么样的图表(以下选择的都是常用表格)
- 表格
- 散点图
- 折线图
- 柱状图或条形图
- 尽量避免使用饼图,3D图表
4.你看到的可视化结果是否有意义
自问:现在的图表能突出我想表达的效果吗,能回答提出的问题吗?如这里,我想找到在那所城市更容易找到数据分析师的工作?但这个图表略显杂乱,所以需要进行排序
如何避免制作图表中的坑
- 点,点上的数据,网格线去掉
- 文字部分不要倾斜,
- 图例直接在图表图形上,
如何用EXCEL绘制图表
- 插入想要的图表:剪切图表,新建工作表
- 删减不必要的元素:+号去除网格,图例,标题,右键去除隐藏全部字段
- 背景填充:右键表格填充为白色,全选填充为白色
- 调色:RGB自定义调色
- 字体:标题用框,字体为微软雅黑,颜色为白色,数字为Arial,
- 对齐方式:左对齐
- 标注数据来源
项目实战
- 场景假设:作为母婴店的数据分析师,我分析了最近的销售量,现在需要在10min内向销售主管汇报工作,如何用图表更好展示?
- 最近的销售是什么情况
1/1-2/5日这段时间,虽然图表显示日销量不稳定,最低日销量为36件,最高日销量达1552
但是,实际上这组数据的众数57,最能代表这组日销量情况,超过57的日销量是一个用户购买一个购买多见。


- 以下部分是对上述图表的解释内容
选择今年开张的销售数据,即2015/1/1-2015/2/5,每日的销售数量。
选择销售量汇总信息进行描述统计分析,众数,中位数,平均值相差很大,说明受到异常数据的影响。我这里选择57众数,对低于,高于它的数据分析分析。
选择行-商品编号,列-数值,值-求和项:购买数量,值-计数项:用户ID。分析表格如下表



之前的分析,我们知道商铺用户二次购买率为0.06%,且愿意二次购买的用户都为一次购置少于5件的用户。那么如果购买数量求和项减去用户ID计数项之差,大于5,说明这里存在可能为刷单行为的异常值。现在我把存在异常值的商品二级分类收集起来。

2,为什么销售量会是这个情况?
1.日销售量为57:商铺用户二次购买率低,日销量基本都是新增用户数
2,销量的变化是由少数商品引起的,这些商品的特点是用户一次购买多件
- 以下是对上面结论的分析部分。
- 为了避免2015年数据过少造成结果的偶然性,现在选取全年数据再次分析二级分类目录下商品销量排行榜,发现购买数量较多都集中在个别商品上, 而且这些商品同样出现在2015/1/1-2015/2/5-商品销量排行表上。


3,说说我们现在怎么办?工作怎么才能更上一个台阶?
对顾客能够一次购买多件的商品多进货,并进行营销活动。