数据分析项目--黑色星期五--Python分析

本文通过Python对黑色星期五购物数据进行分析,包括客户性别、年龄、职业、婚姻状况、居住地和居住时长对消费的影响,以及产品销售情况。数据显示,男性消费者在数量和消费额上均超过女性;25-35岁年龄段的客户购买力最强;C城用户最多但人均消费额最低;居住1年的人群消费总额最高,但人均消费额3年的人群最高。前10名商品销量和消费金额有50%重合,20%的主要用户贡献了73%的消费额。
摘要由CSDN通过智能技术生成

分析说明

数据:Kaggle数据集黑色星期五,已经有很多人分析过了,还是借着别人的笔记以及自己的理解,自己做一遍最好,发现问题,及时复盘才是学习的良好方法。

数据字段说明:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UNdfe30U-1577540940518)(https://margaret.camliar.com/upload/2019/12/%E5%9B%BE%E7%89%87-e448881c9ad944d1ba0ba1d70374d2e5.png)]
职业代码是里面没有写出及具体的职业,只用数字代替的,总共20种
城市分类也是定义A,B,C三类
婚姻状况中0未婚,1已婚
图片.png

分析思路

几乎与销售相关的都可以从产品、客户、销售情况三大维度着手分析
对于销售情况,可以做总体的一些分析,
比如销售总额,总订单数,客户平均消费额,平均订单额,
销售额最高的TOP10商品,消费最高的TOP10的VVIP用户
从客户情况分析,借助已有的数据,对客户性别、年龄、职业、婚姻、居住地、居住时间长短对消费的影响做分析
产品的分析基本也是结合客户特征做分析的

1.数据查看清洗
import numpy as np
import pandas as pd
data=pd.read_csv('BlackFriday.csv')
data.info()
dt=data.rename(columns={'User_ID':'用户ID','Product_ID':'产品ID','Gender':'性别','Age':'年龄','Occupation':'职业','City_Category':'城市',
                      'Stay_In_Current_City_Years':'居住时长','Marital_Status':'婚姻状态',
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值