基于天池淘宝用户100万条行为数据分析——SQL、Tableau

本文基于天池淘宝用户100万条行为数据,使用SQL进行数据清洗,分析用户获客、留存、行为情况,并通过Tableau进行数据可视化。通过留存率、跳失率、用户行为时间序列分析等,揭示用户行为规律,提出营销策略建议,如在用户活跃时段推出优惠活动,优化购买转化路径,提高用户满意度。
摘要由CSDN通过智能技术生成

目录

一、项目背景和目的

1.1项目背景

1.2项目目的

二、数据来源和数据清洗

2.1数据介绍

2.2数据清洗

2.2.1观察数据添加需要的字段

2.2.2检查是否存在重复值

2.2.3检查是否存在异常值

2.2.4检查是否存在缺失值

三、用户维度分析

3.1获客情况

3.2留存情况

3.2.1留存率

3.2.2跳失率

3.3行为情况

3.3.1时间序列分析

3.3.2用户转化率分析

3.3.3行为路径分析

3.4 RMF模型

四、商品维度分析

4.1商品浏览排行榜(前十)

4.2商品类别浏览量排行榜(前十)

4.3各类别的热门商品中浏览量前十的

五、结论及其建议

六、数据可视化

一、项目背景和目的

  • 1.1项目背景

    • 移动互联网企业运营管理过程中,需要结合用户行为、商品及其市场等数据分析,对用户开展有针对性的运营活动,提供个性化、差异化的运营策略,以实现运营业务指标。本项目利用sql对淘宝用户行为数据进行分析,结合人货场模型,提供针对性的运营策略。
  • 1.2项目目的

    • 通过对taobao用户行为数据分析,为以下问题提供解释和改进建议:
    • 1、分析用户使用APP过程中的常见电商分析指标,找到用户偏好商品,针对用户行为提出营销策略,提高用户忠诚度。
    • 2、研究用户在不同时间尺度下的行为规律,找到用户在不同时间周期下的活跃规律,在用户活跃时间点推出相应营销策略。
    • 3、建立用户行为转化漏斗模型,确定各个环节的转化率,找到需要改进的环节
    • 4、分析商品特征,寻找⾼浏览商品
  • 二、数据来源和数据清洗

  • 2.1数据介绍

    • 本数据集包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。关于数据集中每一列的详细描述如下:

    • 原数据量太大,本项目仅截取100w条行为数据作为本次数据分析的数据集,使用的 Navicat Premium数据库管理工具连接Mysql 8.0,进行对UserBehavior.csv 数据集的处理
  • 2.2数据清洗

    • 2.2.1观察数据添加需要的字段

      • 各字段数量

      • 预览前十条数据。发现timestamp为整数型数据,可以在后期增加一个字段datetimes,把它修改成日期型。

      • 添加字段前,可以更改一下缓冲值的大小,把缓冲值增加到10g,加快更改的速度

      • 添加字段,根据Timestamp新建datetimes,date,time,hour

    • 2.2.2检查是否存在重复值

      • 可以将userid,itemid,categoryID,timestamp四者进行联合,对数据集分组。

      • 结果:不存在重复值

    • 2.2.3检查是否存在异常值

      • 由于数据集时间范围为2017-11-25至2017-12-3,因此需要对不在该时间范围内的异常数据进行过滤。

      • 结果:存在异常值

      • 处理:去除异常值(注意:是去除异常值,日期范围要正确选择;是or不是and。)

      • 再次检查,删除成功

  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值