电商用户行为数据分析（MySQL+Tableau）

0（Kate）

已于 2023-03-29 21:40:49 修改

阅读量1.6k

点赞数 3

文章标签：数据分析

于 2023-03-29 20:24:20 首次发布

本文链接：https://blog.csdn.net/YL0621/article/details/129826395

版权

一、项目介绍

1.1 项目背景
UserBehavior是阿里巴巴提供的一个淘宝用户行为数据集，用于隐式反馈推荐问题的研究。本数据集包（UserBehavior.csv）含了2017年11月25日至2017年12月3日之间，有行为的约一百万随机用户的所有行为（行为包括点击、购买、加购、喜欢）。

1.2 分析目的
本次分析的目的是通过对淘宝用户行为进行数据分析，为以下问题提供提供解释和改进建议：
①分析用户在淘宝使用过程常见的电商分析指标，并建立用户转化漏斗模型，确定各个环节的流失率，寻找需要优化的环节。
②分析用户在不同时间维度下的行为，找到用户在不同时间周期下的活动规律，并推出相应的活动策略。
③找到用户的商品偏好，针对不同商品找到对应的营销策略。
④通过RFM模型对用户进行分层，对不同类型的用户行为进行分析，并提出相应的运营策略。

1.3 数据来源
数据来源：淘宝用户购物行为数据集_数据集-阿里云天池
UserBehavior是阿里巴巴提供的一个淘宝用户行为数据集，用于隐式反馈推荐问题的研究。
在这里插入图片描述 UserBehavior.csv
本数据集包含了2017年11月25日至2017年12月3日之间，有行为的约一百万随机用户的所有行为（行为包括点击、购买、加购、喜欢）。数据集的组织形式和MovieLens-20M类似，即数据集的每一行表示一条用户行为，由用户ID、商品ID、商品类目ID、行为类型和时间戳组成，并以逗号分隔。关于数据集中每一列的详细描述如下：
在这里插入图片描述注意到，用户行为类型共有四种，它们分别是
关于数据集大小的一些说明如下
二、分析框
三、数据清洗

3.1 导入数据，修改表字段
源数据表字段不明确，修改其名称，同时修改对应数据类型：user_id, item_id, category_id, behavior_type, time_stamp
在这里插入图片描述

3.2 去除重复值
将各字段‘不是null’打钩，并选定userID，itemID，timestamps作为主键。
这一步可以确保表格中没有空值与重复值。
在这里插入图片描述
结果显示没有重复值。

3.3 查找缺失值
在这里插入图片描述
对比查询结果，无缺失值，数据集数据质量较高。

3.4 转换时间格式
在这里插入图片描述
3.5 过滤异常值

剔除异常值
共剔除511条异常值
然后再检查一遍看数据是否已经剔除干净

四、数据分析
4.1 基于用户行为漏斗模型分析用户行为
4.1.1 了解用户行为整体情况
4.1.1.1 常见数据指标统计

独立访客总数（UV）：10202
页面总访问量（PV）：939535
统计区间平均每人页面访问量（PV/UV）：约为92

4.1.1.2 留存率
① 用户次日、3日、5日、7日留存人数
首先查询第一日活跃用户数，同时建立一个新表用来存放留存数据

最低0.47元/天解锁文章

0（Kate）

关注

3
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
电商用户行为数据分析（MySQL+Tableau）

②针对第三象限的商品（销量低，浏览量低）应先分析此类产品过往的流量趋势（是否具有季节性，需要在特定时间推广此类产品），根据流量趋势布局和增加引流入口的数量，看销量是否会随之提升，若提高曝光量后商品的销量还是比较低迷，说明用户对商品不感兴趣，就需要考虑商品是否是用户真正需要的，效果不好的商品可以考虑直接优化掉；忠诚用户的占比最低，这部分用户属于高价值用户，可以针对这部分用户创建会员制度，定制专属的运营策略来保持用户粘性，如专属优惠，专属节日礼品，免费赠品，新品内测，积分兑换购买商品，专属客服等等。
复制链接

扫一扫