数据来源
阿里云天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=45
了解背景:
- Ali_Mum_Baby含有购买数据,包含超过买家购买信息,这些信息由共享信息的消费者提供,以便接收更好的推荐或搜索结果。
- Tianchi_mum_baby有婴儿信息数据,包含了淘宝或天猫消费者提供的孩子的生日和性别。
预览数据:
购买数据
标签(Ali_Mum_Baby) | 定义 | 值 |
---|---|---|
user_id | 用户id | |
auction_id | 购买行为编号 | |
cat_id | 商品种类ID | |
cat1 | 商品属于哪个类别 | |
property | 商品属性 | |
buy_mount | 购买数量 | |
day | 购买时间 | 年/月/日 |
婴儿信息
标签(Tianchi_mum_baby) | 定义 | 值 |
---|---|---|
user_id | 用户id | |
birthday | 出生日期 | |
gender | 性别 | 0 男性;1 女性 |
提出指标:
运营:成交量、退货率、换货率、运营效率、采购率、库存、供应链指标 。
用户:注册会员、活跃会员数、活跃会员比率、会员复购率、平均购买次数、会员回购率、会员留存率、会员流失率、 价值用户 。
产品: 累积销售量 、商品属性、产品受众。
提出问题:
-
婴儿不同性别更喜欢哪个类别?
通过cat_id,cat1,buy_mount三个字段可统计出用户最常购买商品(各商品的购买
数量求和),结合gender字段,分别统计不同性别婴儿的用户中商品购买量的平均值,判断出该结果是否受婴儿性别影响,商户可针对性地加大部分商品的进货量。 -
用户购买时间是否受节假日/营销活动影响?
通过day,buy_mount,cat1,user_id四个字段可统计出用户下单次数的时间趋势,结合营销活动日历,判断出用户购买行为是否受节假日/营销活动影响。 -
用户复购率最高的是哪种商品种类和类别?
通过user_id,cat_id,cat1,day,buy_mount可统计出用户复购的平均时长、商品种类和类别。
用户细分
依据数据拥有的特征,可分析出下面几个指标:
- 各个年龄段的孩子的性别。
- 男孩女孩分别的购买量。
- 男女分别喜好的类别。
各个年龄段的孩子的性别
- 0到2岁的婴儿,男女比例均衡。
- 在2岁后的婴儿,会为男孩购买母婴用品的比例开始上升。
- 直到9岁,只有为男孩购买用品的用户。
因为销售的是母婴用品,所以销量以可见的速度随年龄升高而下降。
男孩女孩分别的购买量
男孩和女孩比例基本相同,男孩购买比例稍高一些。
男女分别喜好的类别
有男孩的用户更加偏好50008168类别的产品。
除了50008168类别,其余男女喜好的类别并无太大区别。
运营面
可分析的指标:
- 复购率
- 月销售量、季度销售量、年度对比
用户一单购买量大部分为1件,只有少数会多量购买。
复购率
用户复购的比例仅0.08%
月销售情况
结论:
- 每月同比上年都有着销量的提升。
- 旺季在3,4,5,9,10,11,12月份;(合计7个月)
淡季在1,2,6,7,8月份,尤其在1,2月份下降严重;(合计5个月) - 1, 2月更多的是春节、年末的影响。
每月购买量和婴儿出生日期
暂未发现太大关系
季度表现
2015年第一季度的数据并不完整,记录的时间仅到2月初,不在此分析。
可以清晰地见到销量逐年稳步上升。
商品种类
全部商品的总累计销量为 6099 件
三款破千销量产品至最新统计2015年2月,仍在出售。
按销量分级
大部分为0~50件,销量为1的最多。
产品面
这里举例销量最高的产品进行分析:50013636
购买人群:
销量曲线:
逐年上升