navicat黑色_“黑色星期五”之SQL浅析

67fe3a465cd21f02fbb35826edd9a364.png

一、分析背景

关于黑色星期五这一叫法的起源,由于这一天是感恩节(11月第四个星期四)后开业的第一天。再加上人们通常由此开始圣诞节大采购,很多商店都会顾客盈门从而有大额进帐。传统上商家会用不同颜色的墨水来记账,红色表示亏损即赤字,黑色则为有盈利。商家把这个星期五叫做黑色星期五,用以期待这一天过后,年度营收由负转正,由红字转为黑字。

通过分析销售数据,提出相应的优化建议,达到增加销售额的目的。

二、零售行业分析指标

文昌北路de屌丝:零售行业的数据分析指标​zhuanlan.zhihu.com
d3dbffdd015df177834c5f72abef70e9.png

三、数据理解

在kaggle上获取了某商场某次黑五的销售数据。数据地址来源:

Black Friday​www.kaggle.com

数据列名含义:

User_ID:用户编码

Product_ID:产品编码

Gender:性别,M-男性,F-女性

Age:年龄,共7个年龄段,分别为0-17,18-25,26-35,36-45,46-50,51-55,55以上

Occupation:职业,共21类,分别用0-20代表

City_Category:所在城市类别,共3类,分别为A,B,C

Stay_In_Current_City_Years:所在城市时长,共5类,分别是0,1,2,3,4+

Marital_Status:婚姻状况,共2类,以0,1代表, 0未婚,1已婚

Product_Category_1:产品分类1

Product_Category_2:产品分类2

Product_Category_3:产品分类3

Purchase:购买金额

四、分析思路及提出问题

e9bf9418381f901bfacf3f5a520f615e.png

基于人、货、场的分析思路提出以下问题:

1、总体销售情况如何(包括客单价、件单价)?

2、消费者的年龄分布情况?

3、消费者的性别、婚姻状况与销售额的关系?

4、消费者的职业分布情况?

5、各城市的消费情况对比?

6、畅销产品TOP5?

五、数据导入及预处理

1、将获取的EXCEL数据表Black-Friday(原始数据)导入NAVICAT。

2、检查导入数据是否有漏项,EXCEL中共有数据537578行(包含列名1行),在NAVICAT中使用MYSQL语句查询共有537577行(不含列名),数据全部导入成功。

9e5e058f6a1cc9f03d7cbca8b759c811.png

de0bf28d4cecbadab3fdfe5f5859c5d3.png

3、重复值处理

①每一条数据对应的是某客户购买的商品信息和该用户的个人信息,存在同一客户购买多件商品以及某一件商品被多个客户购买的情况,因此无法以单独某一列来确定是否存在重复值。

②在此以User_ID拼接Product_ID的形式查看,不存在重复数据,依然有537577行数据

9e804bf76340e2414011e99574a08ad6.png

六、问题分析

1、总体销售情况如何?

9488b39f5b8a93dce4760baa3abb8487.png

① 黑五活动期间总销售金额为5017668378元。

② 客单价为851751.55元。

③ 件单价为9333.86元。

2、 消费者的年龄分布?

109ec54f9ecffb1083242612e549c1c8.png

f466feb83913b230bc9aec6e30dcbbe0.png

f4aafee3eb43a39dbf80829b713676d1.png

26-35岁的人群是消费主力军,无论从消费人数、消费总金额、客单价上看都是最高的一个年龄段。判断应该属于有稳定工作和收入来源的人群。

3、消费者的性别、婚姻状况与销售额的关系?

03389651072b3d09c986d70932e6d94e.png

6a36e14f16e049c577864c92efbb13e1.png

① 总体来看男性购买力大于女性。

② 其中未婚人士购买力大于已婚人士。

③ 消费金额排序:未婚男>已婚男>未婚女>已婚女

看来结了婚的女性还是比较持家的。

4、消费者的职业分布情况?

f9bb98faaf0d487699e825b806344db0.png

e63269f8cfed3a34f0e305f83588d5f5.png

① 消费最高的职业4的人群。

② 消费最低的是职业8的人群。

5、各城市的消费情况对比?

ab9ca8045cd54f6d28adc63a63d19517.png

c2c12c32c20096d385095312fe80a25b.png

1a0ccfff51d8c28cff3d7f845cf9822f.png

① 各城市的销售金额占比:B城市(41%)> C城市33%> A城市(26%)。

② 通过对比各城市消费人数和客单价发现,B城市和A城市客单价相差无几,C城市虽然销售金额占比第二,实际上客单价较低,但消费人数较多。

推断B城市和A城市可能是经济相对较为发达的地区,C城市可能处于发展中地区。

6、畅销产品TOP5?

0a585a256571bbc02bbf9a992044d70a.png

a050a8922b22e8637bc5a3096d923f72.png

畅销商品TOP5的编号分别为:P00265242(1858件),P00110742(1591件),P00025442(1586件),P00112142(1539件),P00057642(1430件)。

fb889db77db15d54460149fbf052950f.png

另外有596件商品销售量小于等于10件。可以考虑多做促销或者作为赠品捆绑销售。

七、建议总结

1、针对主要消费人群,要维护好客户关系,提高客户粘性,延长客户生命周期价值。针对低消费人群,考虑增加客户问券调查,发放优惠券、打折券等,提高客户满意度。

2、城市B和A的客户作为高端消费者,要为维护好客户权益,增强其品牌认同感,提高品牌忠诚度。对于城市C的客户,主要作为大众市场投放相应中低端产品,策划促销活动。

3、针对销售较好的商品,应加大库存,提前做好销售准备。对于销量较差的商品分析原因,考虑多做促销、加大折扣,作为赠品捆绑销售,确保在质保期前清仓。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值