背景
美国圣诞节大采购一般是从感恩节之后开始的。在这一天,美国的商场都会推出大量的打折和优惠活动,以在年底进行最后一次大规模的促销。因为美国的商场一般以红笔记录赤字,以黑笔记录盈利,而感恩节后的这个星期五人们疯狂的抢购使得商场利润大增,因此被商家们称作黑色星期五。我们想了解黑五一个销售情况
一、确立和识别问题
美国黑色销售情况分析思路
销量情况:总销售额,订单量,订单均价
商品维度:最受欢迎的商品是哪些
用户维度:在性别、年龄、职业、城市居住地、婚姻状况不同情境下购买力分布情况如何?哪些是高价值用户?
二、建模及数据收集
1、收集数据:
数据来源:黑色星期五数据集来自https://www.kaggle.com/mehdidag/black-friday
2、理解数据:
明确数据各字段定义
User_ID:用户编码
Product_ID:产品编码
Gender:性别 (M为男性,F为女性)
Age:年龄(0-17,18-25,26-35,36-45,46-50,51-55,55+ 7种)
Occupation:职业(用数字代表具体职业,一共有20种职业)
City_Category:城市分类(分为三类城市:ABC)
Stay_In_Current_City_Years:在目前城市的居住的年数 (0,1,2,3,4+5种)
Marital_Sta