一、数据集介绍
数据集来源:
Baby Goods Info Data-数据集-阿里云天池
- 会员基础信息表
-
销售数据表
二、数据字段描述
次数据是关于婴儿商品的,共两张表:
-
表一会员(婴儿)信息表,共954条数据:
- user_id:用户id
- birthday:出生日期
- gender:性别(0 男性;1 女性)
-
表2为购买商品:
user_id:用户id
auction_id:购买行为编号
cat_id:商品种类id
cat1:商品属于哪一个类别
property:商品属性
buy_mount:购买数量
day:购买时间
三、从数据中能得到哪些信息?
- 产品分类数量
- 单品销量如何
- 月平均销售和年平均销量是多少
- 购买的用户中,男女比例是多少
- 用户年龄阶段
- 不同年龄阶段的购物倾向
- 用户生命周期
四、确定业务分析问题
五、数据清洗
这里由于数据量比较小,可以使用Excel进行处理,但是本着能用代码装X的就不用软件的理念,比较喜欢使用python进行处理,主要是怕代码太久不敲,就没感