前言:学以致用,学习重要,输出更重要!
在学习SQL的时候,一直有个疑问,用EXCEL就好了啊,SQL学起来干嘛用,直到SQL基础部分学完了,开始做练习,才发现二者的不同。
两个作用差不多,EXCEL处理小数据,SQL处理大数据,且数据来源也不一样。两个可以结合来用,可以更省时省力,各有优缺点,下面就黑五数据用两个方法对比分析体验一下。
相关信息:美国圣诞节大采购一般是从感恩节之后开始的。感恩节是每年11月的第四个星期四。因此它的第二天,也就是美国人大采购的第一天。在这一天,美国的商场都会推出大量的打折和优惠活动,以在年底进行最后一次大规模的促销。因为美国的商场一般以红笔记录赤字,以黑笔记录盈利,而感恩节后的这个星期五人们疯狂的抢购使得商场利润大增,因此被商家们称作黑色星期五。商家期望通过以这一天开始的圣诞大采购为这一年获得最多的盈利。
本次数据来源https://www.kaggle.com/mehdidag/black-friday
提出问题
1. 基本销售信息
2. 寻找畅销商品及商品大类
3. 寻找优质客户群体
4. 地域对商品的需求差异
5. 对客户进行用户画像,培养客户购买习惯
理解数据
User_ID:用户
Product_ID:产品
Gender:性别
Age:年龄段
Occupation:职业
City_Category:城市类别
Stay_In_Current_City_Years:居住年限
Marital_Status:婚姻状态
Product_Category_1:产品分类1
Product_Category_2:产品分类2
Product_Category_3:产品分类3
Purchase:金额
数据清洗
原数据进行备份,确定分析字段,处理相关数据:
删除重复值:
1.基本销售信息:
SELECT
COUNT( DISTINCT User_ID ) AS 用户数量,
count( * ) AS 交易次数,
SUM( Purchase ) AS 交易总额,
round( count( * ) / COUNT( DISTINCT User_ID ), 0 ) AS 人均交易次数,
round( SUM( Purchase ) / COUNT( DISTINCT User_ID ), 0 ) AS 人均支出金额,
count( DISTINCT Product_ID ) AS 产品数量,
round( count( * ) / count( DISTINCT Product_ID ), 0 ) AS 平均销量
FROM
blackfriday
2.寻找畅销商品及商品分类
产品分类1为5的P00265242是最受欢迎的商品
SELECT
Product_ID AS 产品,
Product_Category_1 AS '产品分类1',
SUM( Purchase ) AS 金额,
count( Product_ID ) AS 频次
FROM
blackfriday
GROUP BY
Product_ID
ORDER BY
count( Product_ID ) DESC
SELECT
Product_ID AS 产品,
Product_Category_1 AS '产品分类1',
SUM( Purchase ) AS 金额,
count( Product_ID ) AS 频次
FROM
blackfriday
GROUP BY
Product_ID
ORDER BY
count( Product_ID ) DESC
LIMIT 20
TOP 20
SELECT
Product_Category_1 AS '产品分类1',
ROUND( count( User_ID ) / ( SELECT COUNT( * ) FROM blackfriday ), 3 ) as 交易频次占比,
ROUND( SUM( Purchase ) / ( SELECT SUM( Purchase ) FROM blackfriday ), 3 ) as 金额占比
FROM
blackfriday
GROUP BY
Product_Category_1
ORDER BY
SUM( Purchase ) DESC
产品分类1为1,5,8的商品为畅销品
寻找优质客户群体
SELECT
Gender AS 性别,
COUNT( DISTINCT User_ID ) AS 客户数 ,
SUM( Purchase ) AS 金额
FROM
blackfriday
GROUP BY
Gender
SELECT
Gender AS 性别,
Age AS 年龄段,
COUNT( DISTINCT User_ID ) AS 客户数 ,
SUM( Purchase ) AS 金额
FROM
blackfriday
GROUP BY
Gender,
Age
ORDER BY
SUM( Purchase ) DESC
男士购买力超过女士,18-45岁为主要消费群体,其中26-35尤为明显。
地域对商品的需求差异
SELECT
City_Category AS 城市,
Stay_In_Current_City_Years AS 居住年限,
COUNT( User_ID ) AS 交易次数,
SUM( Purchase ) AS 交易金额
FROM
blackfriday
GROUP BY
City_Category,
Stay_In_Current_City_Years
ORDER BY
SUM( Purchase ) DESC
居住年限1年期客户购买力最大,且城市B为重点销售区域。
对客户进行用户画像,培养客户购买习惯:
通过对消费者行为分析,在非活动期间可展开针对性精准营销。
如将畅销商品大类推送到男士,年龄在26-35岁,居住年限1年期的客户。
优化上架商品,做到购销存商品数量合理,加大畅销品的复采率,降低非畅销品的库存,或在促销中当做赠品赠送,提高资金周转率。
结论:
1.作为分析工具,EXCEL和SQL可以相结合应用。
2.作为数据分析,提出好的问题才是关键。对于这次分析,只能是如此浅显的分析,在业务能力上还是要自行提高,不但要知道看的见的,对于看不见的,也要触摸到。