“黑色星期五”数据分析实战

项目背景

         美国圣诞节大采购一般是从感恩节之后开始的。感恩节是每年11月的第四个星期四。因此它的第二天,也就是美国人大采购的第一天。在这一天,美国的商场都会推出大量的打折和优惠活动,以在年底进行最后一次大规模的促销。这有点类似于淘宝的双十一购物节。项目中所使用的数据是零售商店中黑色星期五的约54万条交易样本数据,商店希望更加了解用户购买行为。所以本项目通过总结本次“黑五”销售状况,分析和研究不同用户对不同产品的购买行为来为下一次“黑五”提供相关参考。

 字段说明

字段 含义
User_ID 用户编码
Product_ID 产品编码
Gender 性别 (M为男性,F为女性)
Age 年龄(0-17,18-25,26-35,36-45,46-50,51-55,55+ 7种)
Occupation 职业(用数字代表具体职业,一共有20种职业)
City_Category 城市分类(分为三类城市:ABC)
Stay_In_Current_City_Years 在目前城市的居住的年数 (0,1,2,3,4+5种)
Marital_Status 婚姻状况 (0代表未婚,1代表已婚)
Product_Category_1 产品分类为1(不能为空)
Product_Category_2 产品分类为2(可以为空)
Product_Category_3 产品分类为3(可以为空)
Purchase 购买金额 (单位为美元)

数据总览

import pandas as pd
data=pd.read_csv('BlackFriday.csv')
data.drop_duplicates(inplace=True)#去重
print(data.info())
Data columns (total 12 columns):
User_ID                       537577 non-null int64
Product_ID                    537577 non-null object
Gender                        537577 non-null object
Age                           537577 non-null object
Occupation                    537577 non-null int64
City_Category                 537577 non-null object
Stay_In_Current_City_Years    537577 non-null object
Marital_Status                537577 non-null int64
Product_Category_1            537577 non-null int64
Product_Category_2            370591 non-null float64
Product_Category_3            164278 non-null float64
Purchase                      537577 non-null int64
dtypes: float64(2), int64(5), object(5)

数据集中共有约54万条数据,Product_Category_1 不能为空,Product_Category_2 和Product_Category_3 可以为空。因此数据不存在缺失值。

数据分析内容

该项目我们从,销售画像,用户画像、商品画像三方面来进行分析

销售画像

销售画像将从以下销售情况,用户情况,商品情况,这三个方面进行分析。

销售情况:

print(data['Purchase'].sum())

此次‘黑色星期五’总成交额达到了5017668378美元。

用户情况:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值