电商用户行为数据分析实战(MySQL +PowerBI)

一、项目概况

本项目以淘宝电商用户真实行为数据为数据源,运用Navicat 12 for MySQL对其进行数据清洗,利用AARRR模型和RFM模型对其展开数据分析,利用PowerBI制作可视化图像。

二、数据源

数据来自阿里巴巴天池:UserBehavior.csv
本数据集包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购物车、收藏)。数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。

数据集字段如下:

用户ID:字符串类型,用户名ID

商品ID:字符串类型,商品种类ID

商品类目ID:字符串类型,商品所属类目ID

行为类型:字符串类型,用户行为类型,包括pv(点击商品详情页面)、buy(购买商品)、cart(将商品加入购物车)、fav(将商品收藏)

时间戳:行为发生的时间戳

三、数据清洗

3.1 选择子集导入,匹配适合的数据类型

在navicat中将数据集导入MySQL,考虑到原数据集体量较大,此次分析仅导入10万条数据。
导入数据时,如果把timestamps设置成了datetime数据类型,则这一字段回全部显示为0。为了成功导入应将timestamps字段的数据类型选择为varchar,之后再利用MySQL语句修改为日期。

3.2 列重命名

由于导入的数据没有列名,因此为各字段添加英文列名

用户ID——userid、商品ID——itemid、商品类目ID——categoryid、行为类型——behavior、时间戳——timestamps

3.3重复值处理

通过将userid,itemid,timestamps三个字段设置为主键,可知数据中没有重复值。

3.4 缺失值处理

利用count函数统计每一个字段包含的数据行数

SELECT COUNT(userid),
       COUNT(itemid),
       COUNT(categoryid),
       COUNT(behavior),
       COUNT(timestamps)
FROM UserBehavior;

在这里插入图片描述在这里插入图片描述

3.5 异常值处理

从timestamps字段中提取日期数据列

新增dates日期列和hours时间列

ALTER TABLE UserBehavior ADD dates varchar(255);
UPDATE UserBehavior SET dates=FROM_UNIXTIME(timestamps,'%Y-%m-%d');
ALTER TABLE UserBehavior ADD hours varchar(255);
UPDATE UserBehavior SET hours=FROM_UNIXTIME(timestamps,'%H:%m:%s');

修改后的表格内容▼修改后的表格内容

查看日期列数据异常情况

主要查看日期列是否出现2017-11-25至2017-12-3之外的数据,只需查询日期的最大值和最小值即可。

SELECT min(dates),max(dates) from userbehavior;

运行结果如下▼在这里插入图片描述
可见最小日期为2017年9月11日,早于2017年11月25日。继续查询不符合要求的数据。

SELECT * from userbehavior where dates < '2017-11-25';

运行结果如下▼
在这里插入图片描述
超出日期范围的共有44条,将其删除。

DELETE from userbehavior where dates<'2017-11-25';

在删除数据时一定要再三检查条件内容的正确性,稍有差池都会导致数据的无法恢复,只能重新导入,从头再来。

在这里插入图片描述在这里插入图片描述
再次查看日期范围

SELECT min(dates),max(dates) from userbehavior;

在这里插入图片描述
可见超出日期范围的数据已被清除。

四、数据分析

4.1 整体购物情况,基于AARRR模型

4.1.1 各字段的统计数据

该数据集包含983位用户,64440个商品,3128个商品,4种用户行为。

在这里插入图片描述

4.1.2 基于AARRR模型分析

(1)用户获取Acquisition

模型中的用户获取一般考察渠道曝光率、渠道转换率、日新增用户数DNU、获客成本CAC等指标。
由于字段限制,本篇分析主要考察日新增用户数DNU。由下图可见,仅在11月25日-30日这六天有新增用户,且新增用户数在26日开始出现急剧下跌,虽然在25日当日的新增用户中有很大一部分是此前的活跃用户,而非当日新增,但在30日的新增用户数已下降为个位数。
在这里插入图片描述

(2)用户激活Activation
PV,UV,人均浏览次数

经过清洗后的数据共有99955条,PV为89664,UV为983,人均浏览次数约为91.22。

时间维度下的用户行为

从日期、时段、星期三个时间维度来观察用户行为。
在每日用户行为中,从11月30日开始至12月2日,pv和cart都有较大的增幅,fav也出现明显的增长趋势,但buy依旧处于较小的波动状态。可能是因为临近双十二,用户在收罗商品准备到优惠力度最大的时候才下单。
在这里插入图片描述
从各时段来看,晚间20点-22点是用户活跃的高峰期,下午15点会有一个小高峰。而下午18-19点是用户增长最快的时段。
在这里插入图片描述
从星期来看,周末时的用户更活跃,而工作日期间的活跃度波动较小。
在这里插入图片描述

跳失率

浏览页跳失率=仅有点击行为的用户数 / 总UV,为7.02%。具体是指用户仅仅有pv行为,没有其它的收藏、加购、购买行为。较低的浏览页跳失率表明用户对目标页面和推荐商品有一定兴趣。

在这里插入图片描述

关键页跳失率=有收藏或加购行为但无购买的用户数 / 总UV,为51.88%。结合前面按日期分布的用户行为特征分析,由于临近双十二,较多用户会选择收藏或加购商品,在等待优惠更大的时机再购买。另一方面,可能是由于商品的库存不足、码数颜色缺货等问题。
在这里插入图片描述

(3)用户留存 Retention

由于本数据集的日期只有9天,这里主要考察次日留存率、3日留存率和7日留存。可以看到进入12月后,留存率有所增长,表明双十二的预热起到一定效果。
在这里插入图片描述

(4)用户推荐 Referral

用户的购物路径包含四条,如下所示:
在这里插入图片描述

假设以上步骤只能依次进行或中断,不能跳过中间过程到下个节点。为了更具体考察用户在不同流程中的行为转化率,将拆解各条路径的步骤,得出各步骤的转化率。

  • 从点击到购买的转化率仅为1.45%,点击到加购的转化率为3.63%,说明用户对推荐商品的满意度不够高,推荐系统和搜索功能有待完善。
  • 从点击到收藏的转化率为1.21%,收藏到加购的转化率为8.86%,反映用户的心仪备选商品也较少,可能平台缺乏用户满意的商品。
  • 从三个购买转化率来看,点击-收藏-加购-购买这条路径的购买转化率较高,表明较多的用户是经过比较长的路径才到达购买页面。可在收藏、加购页面增加更多优惠提醒,精准的发放优惠券、满赠券来鼓励加入购物车的访客提交订单付款成功。还可与其他知名平台合作,加大优惠力度,增加免密支付、极速支付、月付等方式提高下单效率。
    在这里插入图片描述
(5)用户收益Revenue

在这九天内的用户购买次数有0-28次,少量用户在九天内完成2次以上的购买,出现8次以上的购买可能是剁手党所为,也可能是刷单行为。整体复购率为65.87%,比较客观,可针对复购用户的喜好和习惯调整平台首页的各栏目显示顺序和展示区域,在提供更便捷的服务的同时鼓励用户尝试其他板块的体验,以便展示更多推荐商品和增加引流。

在这里插入图片描述

4.2 用户价值分析,基于RFM模型

RFM模型是根据客户活跃程度和交易金额的贡献,进行客户价值细分的一种方法。从客户最近一次交易时间间隔(Recency)、客户最近交易次数(Frequency)、客户最近交易金额(Monetary)三个指标来衡量用户价值。

本报告对于RFM指标的定义如下:
在这里插入图片描述

  • 重要价值用户:R高F高。这类用户是平台的高质量用户,他们已为平台做了较多的贡献,应给予优惠回馈性服务和个性化服务,以鼓励他们持续购买的热情。
  • 重要发展用户:R高F低。这类用户最近有购买行为但频率不高,可向其提供忠诚度计划,推荐更符合用户喜好、性价比高的商品,吸引其购买,逐渐提高忠诚度。如果是新客户,则需要建立关系,提供新人优惠券鼓励消费。
  • 重要保持用户:R低F高。活跃度低的用户可通过短信等场外提醒来引导其入场参与优惠活动,并提供更新产品来鼓励他们再次购买。还可以鼓励其对之前购买的商品做评价以提高商品热度和可信度。
  • 重要挽留用户:R低F低。这类用户容易流失,需要重点挽留,必要时可主动联系客户询问流失原因。可通过拼团打折、积分兑换、捆绑销售、热卖热点商品等活动唤起用户注意力,提升用户兴趣。

在这里插入图片描述

4.3 商品销售分析

依据购买次数来考察商品类别和商品种类的销售情况。
成交量>=10的商品类别如下所示▼
在这里插入图片描述
虽然近97%的商品无人购买,但这主要是由于统计时间过短,部分商品的购买具有季节性,所以在该时间段出现低销量的现象。此外,这些低销量的商品的存在虽然仅能满足极少数客户的需求,但其利润可通过长尾效应积累获取,同时还能为平台营造有层次感的购物氛围,部分商品还能烘托出主流商品的优势,让客户更有信心购买。
在这里插入图片描述

五、总结

关注活动前后指标数据,优化推荐策略和搜索功能
  • 新增用户的数据不够理想,应观察各渠道的用户获取情况,以及竞争平台近期是否在举行促销活动。
  • 用户的活跃度应该结合平台的活动时段分析,考察是否符合预设目标值,同比环比等。本篇分析发现周末晚间20点-22点是用户活跃高峰期,应针对高峰期进行有效的营销活动,从而更容易触达用户。
  • 用户对推荐商品的满意度不够高,需要优化推荐策略和搜索匹配度,为用户减少搜索和选择的时间,加速完成购买行为。
  • 较多的用户是经过比较长的路径才到达购买页面。可在收藏、加购页面增加更多优惠提醒,精准的发放优惠券、满赠券来鼓励加入购物车的访客提交订单付款成功。还可与其他知名平台合作,加大优惠力度,增加免密支付、极速支付、月付等方式提高下单效率。
针对用户群体特征采取差异化营销
  • 重要价值用户:通过提供优惠回馈性服务和个性化服务,鼓励持续购买的热情。
  • 重要发展用户:在优化推荐策略的基础上逐渐提高忠诚度。如果是新客户,则需要建立关系,提供新人优惠券鼓励消费。
  • 重要保持用户:活跃度低的用户可通过短信等场外提醒来引导其入场参与优惠活动,并提供更新产品来鼓励他们再次购买。还可以鼓励其对之前购买的商品做评价以提高商品热度和可信度。
  • 重要挽留用户:可主动联系客户询问流失原因。可通过促销热点商品、拼团打折、积分兑换等活动唤起用户注意力,提升用户兴趣。
邀请新兴热门品牌入驻,调整商品引流通道
  • 平台的商品类别的销量有待提高,可能是平台缺乏用户喜爱的商品,也可能是商品类别的划分不够精准。可通过邀请新兴热门品牌的入驻,引进更多用户和促成热销产品的诞生,增强品类口碑。
  • 针对复购用户的喜好和习惯调整平台首页的各栏目的内容规划、显示顺序和展示区域,在提供更便捷的服务的同时鼓励用户尝试其他板块的体验。还可在成交量较高的商品大类后设置引流通道,为其他相关商品、推荐商品增加曝光量。
  • 优化商品详情页的内容和顺序,提炼热销商品的卖点和精简描述,引导用户迅速掌握商品关键信息,做出购买决策。

六、MySQL代码

# 各字段的统计数据
SELECT COUNT(DISTINCT userid) AS 'customer',
       COUNT(DISTINCT itemid) AS 'item',
       COUNT(DISTINCT categoryid) AS 'category',
       COUNT(DISTINCT behavior) AS 'behaviortype'
FROM
  • 9
    点赞
  • 83
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
Power BI是一种业务智能工具,具有强大的数据分析和可视化功能。它可以从各种数据源中提取数据,并通过数据建模和数据处理功能进行清洗和转换。然后,我们可以使用Power BI的可视化工具来创建丰富多样的报表和仪表板。 Power BI的使用流程主要包括四个步骤:数据获取、数据转换、数据建模和可视化展示。 在数据获取方面,Power BI可以从多种数据源中获取数据,如Excel、SQL Server、MySQL等数据库以及在线服务如Azure、Salesforce等。通过连接这些数据源,我们可以获取到我们所关心的数据,准备开始数据分析。 数据转换是数据分析的重要一步。在这一步中,我们可以使用Power Query对数据进行清洗、筛选、转换和合并。例如,我们可以删除重复数据、处理缺失值、提取关键信息等。这样,我们可以获得高质量的数据集。 通过数据建模,我们可以根据业务需求创建数据模型。Power BI的数据建模工具可以帮助我们进行表之间的关系建立、定义度量和指标等。这样,我们可以更好地理解数据,为数据分析做好准备。 最后,我们可以使用Power BI的可视化工具将数据进行视觉化展示。Power BI提供了多种图表和可视化元素来展示数据。通过选择适当的图表类型,我们可以更直观地展示数据的特点、趋势和关联关系。此外,Power BI还支持创建交互式的报表和仪表板,用户可以自主选择感兴趣的数据进行分析和查看。 总结来说,Power BI数据分析与可视化实战是一种强大的工具,能够帮助用户从数据中挖掘有价值的信息,并通过可视化展示方式进行呈现。无论是商务分析、市场营销还是销售预测等领域,Power BI都可以提供实用的解决方案,帮助用户更好地理解和利用数据。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值