分析说明
数据:Kaggle数据集黑色星期五,已经有很多人分析过了,还是借着别人的笔记以及自己的理解,自己做一遍最好,发现问题,及时复盘才是学习的良好方法。
数据字段说明:
职业代码是里面没有写出及具体的职业,只用数字代替的,总共20种
城市分类也是定义A,B,C三类
婚姻状况中0未婚,1已婚
分析思路
几乎与销售相关的都可以从产品、客户、销售情况三大维度着手分析
对于销售情况,可以做总体的一些分析,
比如销售总额,总订单数,客户平均消费额,平均订单额,
销售额最高的TOP10商品,消费最高的TOP10的VVIP用户
从客户情况分析,借助已有的数据,对客户性别、年龄、职业、婚姻、居住地、居住时间长短对消费的影响做分析
产品的分析基本也是结合客户特征做分析的
1.数据查看清洗
import numpy as np
import pandas as pd
data=pd.read_csv('BlackFriday.csv')
data.info()
dt=data.rename(columns={'User_ID':'用户ID','Product_ID':'产品ID','Gender':'性别','Age':'年龄','Occupation':'职业','City_Category':'城市',
'Stay_In_Current_City_Years':'居住时长','Marital_Status':'婚姻状态',