阿里巴巴数据分析实战:超详细的母婴电商分析流程

随着科技互联网的发展,电子商务在现代商务企业的发展中占有越来越重要的地位,而数据分析作为电商行业非常重要的一种运营手段,在营销管理、客户管理等环节都需要应用到数据分析的结果。本文以阿里巴巴天池的婴儿用品购买数据为例,进行相关分析并提出建议。


1

数据理解

1. 数据来源

笔者在阿里巴巴天池下载的数据

2. 字段含义

2

分析思路

1. 问题

  • 年龄段的分布情况

  • 哪一类商品最受欢迎

  • 不同性别对商品的选择情况

  • 同一商品大类下不同分类的畅销程度

  • 用户购买商品的季节性偏好

2. 思路

产品、用户两个维度展开:


3

数据清洗

1. 在此次的数据分析中不需要用到表1的“物品编号”、“商品属性”列,隐藏该列。

2. 修改列名,改成中文。

3. 表1为用户购买记录,不能排除同一位用户在同一天重复购买相同商品的情况,所以不做重复值剔除,表2用户ID无重复值。

4. 表1各列计数均为29972,表2各列计数均为954,未发现缺失值。

5. 生日、购买日期通过分列功能转化成日期格式,性别通过if函数转换成文本“女、男、未知”,通过vlookup函数多表关联查询功能及datedif函数求得购买年龄。

6. 通过排序和筛选功能,将购买年龄为28岁的数据进行异常值剔除。


4

问题分析

1. 产品维度

(1)一级商品种类按季度汇总销量如下

发现2012年只有三、四季度的销量数据,2015年只有一季度的销量数据且并不完整。为了保持数据完整性,故选取2013、2014年进行分析。

从年度销量数据来看,28居销量第一,其次是50014815,但2014年50014815销量激增反超28夺得销量榜首,28增长率在品类中倒数第一。现通过假设检验分析方法进行具体分析。

假设一:少数客户购买销量巨大,对各品类商品总销量有明显影响

对购买量进行描述性分析,如下图:


大多数的订单购买量为1,最大单笔购买量为10000,标准差为63.99,说明存在少量客户大量购买导致销量剧增的情况,剔除与平均值偏差超过3倍标准差的异常值,即购买数量大于192的数据样本。

进行剔除前后年度销量数据比较如下:

由上图可以看出,2014年50008168的销量激增很大一部分原因来自个别客户的大量购买,剔除异常数据后,28依旧为用户最受欢迎的选择,假设一成立。

假设二:促销活动有带动作用

进行剔除前后季度销量数据比较如下:

由上图可以看出,122650008、50022520、38季度销量比较稳定,28、50008168和50014815销量最多主要在四季度,考虑到大客户订单对销量影响明显,提取这三个品类剔除异常值的四季度日销量进行分析。

可以看出28、50008168和50014815的销量峰值主要集中在11月11日和12月12日前后,推测为双十一和双十二促销活动带动销量的增长,假设二成立。

(2)对一级商品种类内销量前十的二级细分商品销量进行分析

由上图可知,50014815和38中二级商品细类销量排第一的分别是50018831、211122,都在60%以上,各商品销量差距大;而一级商品种类中28、50008168、50022520和122650008购买量排名前2的二级细类商品占比均在40%左右,各商品销量较为均衡。

(3)为了保证数据的完整性和排除个别客户大量订单对数据造成影响,选取2013-2014年异常修正后的数据进行分析。

商品销量在二季度、四季度有增长峰值,对这两个季度进行月销量分析。

二季度和四季度月销量最多的分别是5月和11月,对这两个月份进行日销量和细化一级种类商品销量分析。

由此可以得出,5月销量集中在11日之后和月底,查询当年节日正值母亲节之际和儿童节前期,而11月份销量主要集中在11日前后,为双十一购物狂欢节时期。除此之外,无论是5月还是11月,销量贡献主要集中在一级品类商品28、50008168、38。

(4)复购率

总用户数为29943人,重复购买的用户数一共25人,复购率为0.083%,不到千分之一可以忽略,可能原因有①产品不被客户认可,缺乏用户年度②产品为耐用型。这部分需要额外的数据支撑,这里不再研究。

2. 用户维度

(1)年龄分布情况如下:

提出假设:婴儿年龄越小用户购买需求越大

进行相关分析:


年龄与购买人数的相关系数为-0.86,高度负相关,证明假设成立。

其中,各年龄层偏爱的一级商品种类前三分别是50014815、50008168、28。

(2)性别比例

在总销量中,女婴购买量占52.75%,相比男婴购买量的47.25%高出5.5%,说明女婴的购买需求大于男婴。

由上图可知,50014815最受女婴用户欢迎,50008168最受男婴用户欢迎。

5

结论建议

1. 用户的购买量相差大,少数客户下单量巨大对销量有明显影响,建议做好大客户的服务,保持长期合作关系。

2. 节日性活动对销量提升有明显促进作用,重点关注母亲节、儿童节、双十一和双十二。

3. 销量贡献主要集中在一级品类商品28、50008168、38,根据商品的过往销量情况做好库存管理。

4. 5岁以内是购买主力,随年龄增长购买需求下降,而女婴消费比例略高于男婴,后续策划促销活动可侧重借鉴此类用户画像。

5. 复购率极低,要重点了解原因,如不是因为商品本身特性如耐用品,会有很高的提升空间。

End.

作者:zhazha

来源:知乎

本文为转载分享,如有侵权请联系后台删除

零基础学 Python,请往看下嘛

 只需7天时间,跨进Python编程大门,已有3800+加入

【基础】0基础入门python,24小时有人快速解答问题;
【提高】40多个项目实战,老手可以从真实场景中学习python;
【直播】不定期直播项目案例讲解,手把手教你如何分析项目;
【分享】优质python学习资料分享,让你在最短时间获得有价值的学习资源;圈友优质资料或学习分享,会不时给予赞赏支持,希望每个优质圈友既能赚回加入费用,也能快速成长,并享受分享与帮助他人的乐趣。
【人脉】收获一群志同道合的朋友,并且都是python从业者
【价格】本着布道思想,只需 69元 加入一个能保证学习效果的良心圈子。

【赠予】价值109元 0基础入门在线课程,免费送给圈友们,供巩固

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值