各州的月销售量时间序列
- CA和WI呈逐渐增加的趋势,TX增长较快,然后有点停滞
- CA州和TX州7、8月销量最高,3、4月次高峰,3-7上升,之后下降,12、1月有个反升的最小高峰
- WI州显示出不同的季节性,7、8月见顶,3月见顶,4月见底,中间11月和1、2月有两个小高峰
CA州淡旺季相差最大,TX高峰值相近CA,淡季值稍好些,WI州淡旺季相差不大
不同门店的月度销售量时间序列
- CA系列总体趋势都是上涨的。其中,CA_1和CA_3表现出明显的季节性。CA_2在2015年大幅降低,但在2016年达到顶峰。
- 在TX中,TX_2在2014年之前表现的不错,但在2014年后急剧下降。但仍保持领先的营业额,TX_1显示出微微的增长趋势,而不错的是TX_3一直呈现出增长趋势。
- 在WI中,WI_1和WI_2销售额大幅拉升,在2012、13年的销售额从50K增长到100K。并继续上升,WI_3在2012年业绩大幅拉升后,后两年就下降了很多,但在2016年有所增长。
绘制categories的销售时间序列
- Foods销售额一直远高于household和hobbies
- Hobbies表现出一种非常浅平缓增长趋势和不受季节性影响。
- Foods明显受季节性影响,household可以明显看出逐年增长趋势。
对每个categories的时间序列进行拆解,更加精细了解销售情况。
- FOODS销售额在2012年前快速增长,2012年到2016年增长停滞。其中每年3月份会出现一个小增长,在8月份出现一个大增长。
- 从2012年8月到2013年8月,2014年8月到2015年8月,HOBBIES销售额呈现隔年增长。2013-2014年里,年销售额略微下降。其中3、8、10月份的峰值最为明显。
- HOUSEHOLDS销售额呈现出明显的增长趋势,13-14年增长平缓,且在3月和8月呈现出明显的季节性周期。
绘制部门的月度销售额趋势
- 在FOODS中,FOODS_3的销售额最高,但当季来回波动的季节性很高,从500K到600K。FOODS_2在这若干年内有所增长,而FOODS_1在过去几年中几乎停止不前。
- HOUSEHOLD_1销售额相对于其他部门而言,涨幅表现最佳。 在HOBBIES中,HOBBIES_1销售额变动较大,但总体呈现上证趋势。
绘制每个州的商品种类销售趋势
- 尽管CA的FOODS销售量在每年的8月出现季节性高峰,并在年末和年初(11,12,1,2)有所下降,但这些年涨幅都非常小。
- TX的FOODS销售量在每年8月出现季节性高峰,在1,2月份有所下降,但从2013年往后销售量有稍微下降。
- WI的FOODS销售量无季节性变化,在2012和2015年销售量增幅明显。且在2015年WI的销售额超越了TX,使得总体WI的销售额超越了TX。
- CA的HOBBIES销售量增幅明显,WI和TX销售量上涨走势较为相似。
- CA的HOUSEHOLD销售量涨幅明显, HOBBIES总体上不受季节性影响。
- HOUSEHOLD项目在三个州中都呈现出明显的上涨趋势。
- CA显示了在这些年中HOUSEHOLD销售量增长最佳,并且每月的季节性在8月达到高峰,在12月和1月下降
- TX和WI涨幅趋势相近,但TX的销售量是稍微优于WI州的。且在7、8月份都是增长的,但不能说明有季节性。
2012年3月-8月两者FOODS有一个明显增长,2013年两者的HOBBIES有一个增长,2013,14,15的9、10月都有一个增长;
2012年6-9月两者的HOUSEHOLDS有一个明显增长,2015年的3月有一个增长
周销售量
周销售量均值
星期六的整体销售额最高,可能是因为周末的第一天,人们争相购买日用品,其次是星期天也是周末。
三类商品的周销售量均值
- Sunday和Saturday是FOODS销售的最佳时间段。
- 周六的总销量高于周日的原因是HOBBIES和HOUSEHOLD比Sunday高那么点。FOODS周六比周日高
- 从中可以看出一种周季节性的感觉,周一到Wednesday和Thursday降到最低,然后上升到Saturday和Sunday的销售量最高
月销售量增长趋势
2-5月 6-12月呈现两个山坡,2月和8月是两个山坡的顶点,全年8月最高
三类商品的月度销售量变化
- 8月份的FOODS销量最高,可能是因为节假日或其他气候条件,如高温和高降水
- 8月份的HOUSEHOLD销量也最高
- 四月和六月的HOBBIES销售量最高,但总体而言月销售量非常稳定
月度每天的销售量均值热力图(时间按行增长,一行是一周)
每个月第一、二周销售量最高
三种商品的月每天销售量热力图
- 从中可以看出,食品销售额在每个月的第一二个星期销售量最高
- HOBBIES和HOUSEHOLD在每月的前三天销售量最高,从中可以看出家庭屯货都是以月为单位的?
探究Events和Snap活动对销售的影响
合并日销售额sales_sum和calendar;
绘制2012年的日销量,了解event的影响规律
8.18 8.19 (周六日)Eid al-Fitr ,9.1 9.2 9.3 (周六周日周一)LaborDay 9.9 9.15(不知道是什么节日) 11.3万圣节过后的周六 12.25日销量极低,前一个周六销售有峰值
如果我们仔细观察2012年的销售额,我们会发现人们更喜欢在活动前的周末(最好是周六)购买,而不是在活动当天购买。所以我们看不到活动当天的销售量增加。但之前周末销量的增长,可以归因于这一事件。我们看到一些例外,尽管像劳动节是星期一,我们仍然看到一个高峰在那一天。另一个是感恩节,是在星期四,但我们看到一个高峰在前一天是星期三。
#对event发生前的上一个周末进行标记,用于后面探索分析
##遍历events_days,如果节日是周六,找到overall中这一周,把周六设为e1_e2;如果节日不发生在周六,找到这一周,把这周的周六周日都设为e1_e2。
我们可以看到Super Bowel event发生在周日,我们已经通过weekend_de_event列将其映射到前一个周六和周日。
填充结果
给overall_sales的事件添加上类型
添加结果
计算不同类型event前一周的周末销量的均值,比较不同类型event对周末销量的影响
- 所有活动类型之前的周末的销售额都远高于每天的平均销售额
- Religious活动对上周末的销售影响最大
- National活动对上周末销售的影响最小
每个event对之前周末的影响
- 几乎所有周末的销售额都高于平均水平。所以event确实会影响销售
- 销售额最高的是复活节前的周末,预计每天约44k,其次是艾达拉达,这两个都是宗教活动(以下是我们发现的影响最大的宗教活动类型)。附注:既然宗教类型对销售有影响,是否应该探究一下宗教活动所需物品和进行相关促销活动?
- 最低的销售量是在新年前的周末
各州在有无snap_days时的销售量均值
把三个州每日销量和overall_sales_special拼接
拼接三个州有无snap的销量均值
所有的州在SNAP days都有更高的销售额。我们可以看到最大的WI增长。