教育平台线上课程项目分析

通过对某教育平台数据的分析,发现活跃用户不足一半,流失率为60.66%,用户活跃时段主要在9-11点、14-16点、19-21点。广东省用户登录与学习活跃,北京、上海较少。RFM模型用于用户精细化分类,以提升用户留存和课程推荐。课程受欢迎程度分析显示,免费课程和100-200元区间课程选择人数最多,课程分级策略提出以优化资源分配。
摘要由CSDN通过智能技术生成

项目背景

本项目通过某线上教育平台的数据,对用户行为进行分析,为平台制定综合的线上课程推荐策略。

分析目标

  1. 分析平台用户的活跃情况,计算用户的流失率

  1. 分析线上课程的受欢迎程度,构建课程智能推荐模型,为教育平台的线上推荐服务提供策略。

数据预处理

  1. 数据构成分析

教育平台线上课程数据包含三张表(users、login、study_information)

  • users结构:

  • login结构:

  • study_information结构:

  1. 数据清洗

  • 重复值

使用Excel数据工具-删除重复值,对三张表分别进行处理,只有users表中存在3条重复记录,其余表中存在的是一个用户对应多条记录的情况,因此不存在重复记录。

  • 缺失值

使用Excel筛选功能分别对三张表进行筛选:

users表中user_id存在、recently_logged、school字段中存在缺失值,user_id字段未知,也无法按照默认进行填充,因此将user_id字段缺失行删除;recently_logged字段中存在‘--’,但占比不超过20%,因此将recently_logged字段缺失行删除,school字段在本项目的分析中不起作用,因此将school字段中空白项填充为'N'。

login表中无明显缺失值。

study_information表中price字段存在缺失,经分析为课程51、课程96的价格缺失,属于整体价格缺失,无替代方法,因此采用直接删除的方法处理缺失值。

分析平台用户的活跃情况,计算用户的流失率


  • 分析结论

  1. 活跃用户的占比是不到一半的,其中北京和上海的活跃用户是前15中最少的。

  1. 流失用户的比例高达60%,即用户流失率为60.66%。

  1. 流失用户的流失天数存在三个峰值,分别在15天、75 天、45天达到极高值点。

  1. 用户活跃时间主要集中在上午9-11点、下午14-16点、晚上19-21点。

  • 建议

  1. 一线城市中北京和上海的活跃用户较少,针对此现象,可以对用户进行精细化分类,定位流失率较高的客户群,分析高流失率的原因。

  1. 可根据用户的活跃时间段,在活跃时间段里加大课程的宣传推广力度,以此促进课程的销售数量。


用户流失漏斗模型


  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值