黑五电商数据分析
背景
为了合理的投入人力物力,创造更大的销售利润,现对已有的销售数据进行分析,提出合理的促销计划。本次的分析数据来自于Kaggle提供的某电商黑色星期五的销售记录,将围绕产品和用户两大方面展开叙述,为电商平台制定策略提供分析及建议。
使用工具:MySQL、Tableau、Excel
1. 提出问题:
- 整体的消费情况
- 用户分析
- 产品分析
- 细化分析
2. 数据理解:
部分数据预览:
原始数据中共有12个字段,每个字段共537578行,字段解释如下:
User_ID: 用户ID
Product_ID: 产品ID
Gender: 性别
Age: 年龄
Occupation: 职业
City_Category: 城市(A,B,C)
Stay_In_Current_City_Years: 居住时长
Marital_Status: 婚姻状况(1已婚,0未婚)
Product_Category_1 产品类别1
Product_Category_2 产品类别2
Product_Category_3 产品类别3
Purchase: 金额(美元)
3. 数据清洗:
- 检测并删除重复数据:
SELECT
*
FROM
b_friday
GROUP BY
User_ID,
Product_ID
HAVING
count(*) > 1;
查询结果为空,未发现重复项。
- 缺失值处理:
产品类别2和3字段有大量缺失,不能直接删除,使用0填充,方便后续操作。
UPDATE b_friday
SET Product_Category_2 = 0,
Product_Category_3 = 0
WHERE
Product_Category_2 IS NULL
OR Product_Category_3 IS NULL;
得到处理后的数据:
4. 数据分析:
- 整体消费情况:
SELECT
concat(sum(Purchase)/100000000,'亿美元') 总销售额,
concat (round(sum(Purchase)/count(DISTINCT User_ID)/10000,4),'万美元') 人均消费,
concat (sum(Purchase)/count(User_ID),'美元') 平均每单消费
from
b_friday;
从结果上看,可以大概知道本次的销售记录,记录的主要是大客户的消费数据,人均消费已经达到了85万美元!这些人一共贡献了50亿美金的销售额。
- 用户分析:
(1) 性别:
SELECT
Gender,
count(DISTINCT User_id) 用户人数,
concat(round(count(DISTINCT User_id)/(SELECT count(DISTINCT User_ID) FROM b_friday)*100,2),'%') 用户占比,
concat(sum(Purchase)/100000000,'亿美元') 销售金额,
concat(round(sum(Purchase)/count(DISTINCT User_ID)/10000,3),'万美元') 人均消费,
concat(round(sum(Purchase)/(SELECT sum(Purchase) from b_friday),2)*