实战|淘宝用户行为分析案例

本文通过对淘宝2014年11月18日至12月18日的用户行为数据进行分析,揭示了用户访问量(PV)、独立访客数(UV)、付费率、复购率等关键指标。数据清洗后,发现双十二期间PV和UV达到峰值,用户主要在晚上18点后活跃。此外,用户购买次数主要集中在10次以内,ARPPU和ARPU指标反映了用户的消费强度,付费率在1-2次之间波动。复购情况显示,多数用户在1-5天内会再次购买,但整体复购率较低。最后,分析了用户行为与商品种类的关系,为业务优化提供了参考。
摘要由CSDN通过智能技术生成

(点击上方快速关注并设置为星标,一起学Python)

一、项目背景

本数据报告以淘宝app平台为数据集,通过行业的指标对淘宝用户行为进行分析,从而探索淘宝用户的行为模式,具体指标包括:日PV和日UV分析,付费率分析,复购行为分析,漏斗流失分析和用户价值RFM分析。

二、数据来源

https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1

三、提出问题

1.日PV有多少

2.日UV有多少

3.付费率情况如何

4.复购率是多少

5漏斗流失情况如何

6.用户价值情况

四、理解数据

本数据集共有104万条左右数据,数据为淘宝APP2014年11月18日至2014年12月18日的用户行为数据,共计6列字段,列字段分别是:

user_id:用户身份,脱敏

item_id:商品ID,脱敏

behavior_type:用户行为类型(包含点击、收藏、加购物车、支付四种行为,分别用数字1、2、3、4表示)

user_geohash:地理位置

item_category:品类ID(商品所属的品类)

time:用户行为发生的时间

五、数据清洗

In [1]:

import pandas as pd

import numpy as py

%matplotlib inline

import matplotlib.pyplot as plt

import seaborn as sns

data_user = pd.read_csv('你的数据集位置')

In [2]:

#缺失值处理

missingTotal = data_user.isnull().sum()

missingExist = missingTotal[missingTotal>0]

missingExist = missingExist.sort_values(ascending=False)

In [3]:

print(missingExist)
user_geohash    8334824
dtype: int64

In [4]:

print(missingTotal)
user_id                0
item_id                0
behavior_type          0
user_geohash     8334824
item_category          0
time                   0
dtype: int64

存在缺失值的是User_geohash,有717785条,不能删除缺失值,因为地理信息在数据集收集过程中做过加密转换,因此对数据集不做处理。

In [5]:

data_user.head()

Out[5]:


user_id item_id behavior_type user_geohash item_category time
0 98047837 232431562 1 NaN 4245 2014-12-06 02
1 97726136 383583590 1 NaN 5894 2014-12-09 20
2 98607707 64749712 1 NaN 2883 2014-12-18 11
3 98662432 320593836 1 96nn52n 6562 2014-12-06 10
4 98145908 290208520 1 NaN 13926 2014-12-16 21

In [6]:

#一致化处理

import re

#拆分数据集

data_user['date'] = data_user['time'].map(lambda s: re.compile(' ').split(s)[0])

In [7]:

data_user['hour']=data_user['time'].map(lambda s:re.compile(' ').sp

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值