从情境中学习数据分析,体会数据分析逻辑。今天分享的案例是关于某电商店铺的年终销售业绩的分析哦~
在2011年的圣诞节前两周,老板希望回顾一下过去一年的销售业绩,数据来自该店铺的实际销售记录,其数据周期为2010年12月1日到2011年12月9日。
首先第一步!老生常谈了啊!对基础数据的准备,导入数据并处理。
具体过程:重命名字段、排除重复记录、标记特殊订单、处理客户ID、调整日期字段、补充分析字段、计算预处理后的数据情况然后导出数据。
清洗数据之后导入数据和库,我们得到
我们可以看出,过去一年的总销售额为9,239,800 英镑,店铺的销售额在9月到12月之间的月份有着更高的销售额,同时从9月份开始存在多周的销售额大幅上升。
接下来,我们来看看影响销售额变化的主要因素是什么?
首先考虑大客户的影响
店铺的主要客户是一些批发商,其会一次性购买大量的商品。
图上展示了客户的最大单日商品购买量的分布。其中,最大单日商品购买量 = 客户过去一年中的单日商品购买量的最大值