一、分析背景
关于黑色星期五这一叫法的起源,由于这一天是感恩节(11月第四个星期四)后开业的第一天。再加上人们通常由此开始圣诞节大采购,很多商店都会顾客盈门从而有大额进帐。传统上商家会用不同颜色的墨水来记账,红色表示亏损即赤字,黑色则为有盈利。商家把这个星期五叫做黑色星期五,用以期待这一天过后,年度营收由负转正,由红字转为黑字。
通过分析销售数据,提出相应的优化建议,达到增加销售额的目的。
二、零售行业分析指标
文昌北路de屌丝:零售行业的数据分析指标zhuanlan.zhihu.com三、数据理解
在kaggle上获取了某商场某次黑五的销售数据。数据地址来源:
Black Fridaywww.kaggle.com数据列名含义:
User_ID:用户编码
Product_ID:产品编码
Gender:性别,M-男性,F-女性
Age:年龄,共7个年龄段,分别为0-17,18-25,26-35,36-45,46-50,51-55,55以上
Occupation:职业,共21类,分别用0-20代表
City_Category:所在城市类别,共3类,分别为A,B,C
Stay_In_Current_City_Years:所在城市时长,共5类,分别是0,1,2,3,4+
Marital_Status:婚姻状况,共2类,以0,1代表, 0未婚,1已婚
Product_Category_1:产品分类1
Product_Category_2:产品分类2
Product_Category_3:产品分类3
Purchase:购买金额
四、分析思路及提出问题
基于人、货、场的分析思路提出以下问题:
1、总体销售情况如何(包括客单价、件单价)?
2、消费者的年龄分布情况?
3、消费者的性别、婚姻状况与销售额的关系?
4、消费者的职业分布情况?
5、各城市的消费情况对比?
6、畅销产品TOP5?
五、数据导入及预处理
1、将获取的EXCEL数据表Black-Friday(原始数据)导入NAVICAT。
2、检查导入数据是否有漏项,EXCEL中共有数据537578行(包含列名1行),在NAVICAT中使用MYSQL语句查询共有537577行(不含列名),数据全部导入成功。
3、重复值处理
①每一条数据对应的是某客户购买的商品信息和该用户的个人信息,存在同一客户购买多件商品以及某一件商品被多个客户购买的情况,因此无法以单独某一列来确定是否存在重复值。
②在此以User_ID拼接Product_ID的形式查看,不存在重复数据,依然有537577行数据
六、问题分析
1、总体销售情况如何?
① 黑五活动期间总销售金额为5017668378元。
② 客单价为851751.55元。
③ 件单价为9333.86元。
2、 消费者的年龄分布?
26-35岁的人群是消费主力军,无论从消费人数、消费总金额、客单价上看都是最高的一个年龄段。判断应该属于有稳定工作和收入来源的人群。
3、消费者的性别、婚姻状况与销售额的关系?
① 总体来看男性购买力大于女性。
② 其中未婚人士购买力大于已婚人士。
③ 消费金额排序:未婚男>已婚男>未婚女>已婚女
看来结了婚的女性还是比较持家的。
4、消费者的职业分布情况?
① 消费最高的职业4的人群。
② 消费最低的是职业8的人群。
5、各城市的消费情况对比?
① 各城市的销售金额占比:B城市(41%)> C城市33%> A城市(26%)。
② 通过对比各城市消费人数和客单价发现,B城市和A城市客单价相差无几,C城市虽然销售金额占比第二,实际上客单价较低,但消费人数较多。
推断B城市和A城市可能是经济相对较为发达的地区,C城市可能处于发展中地区。
6、畅销产品TOP5?
畅销商品TOP5的编号分别为:P00265242(1858件),P00110742(1591件),P00025442(1586件),P00112142(1539件),P00057642(1430件)。
另外有596件商品销售量小于等于10件。可以考虑多做促销或者作为赠品捆绑销售。
七、建议总结
1、针对主要消费人群,要维护好客户关系,提高客户粘性,延长客户生命周期价值。针对低消费人群,考虑增加客户问券调查,发放优惠券、打折券等,提高客户满意度。
2、城市B和A的客户作为高端消费者,要为维护好客户权益,增强其品牌认同感,提高品牌忠诚度。对于城市C的客户,主要作为大众市场投放相应中低端产品,策划促销活动。
3、针对销售较好的商品,应加大库存,提前做好销售准备。对于销量较差的商品分析原因,考虑多做促销、加大折扣,作为赠品捆绑销售,确保在质保期前清仓。