电商大数据分析技术

本文通过分析阿里云天池提供的电商数据,揭示了网站PV、DAU、用户留存率和转化率等关键指标。数据清洗后发现异常值并进行处理。分析显示,网站流量在周末有所上升,留存率呈现一定波动,商品销售与浏览行为存在差异,为运营策略提供依据。
摘要由CSDN通过智能技术生成

电商数据分析
一、数据来源、分析目的和思路

  1. 数据来源
    为了做商品、用户购物行为分析,从阿里云天池搜索获取数据集:
    (https://tianchi.aliyun.com/datalab/dataSet.html?spm=5176.100073.0.0.30a36fc1OydpSl&dataId=649)
    该数据集包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(点击、购买、加购、喜欢),数据集信息如下:
    表1 变量信息

编号 变量 说明 数量
1 userid 用户id 987,994
2 itemid 商品id 4,162,024
3 categoryid 商品类目id 9,439
4 type 行为类型:pv(商品详情页pv,等价于点击)、buy(商品购买)、cart(将商品加入购物车)、fav(收藏商品) 100,150,807
5 timestamp 时间戳 -
2. 分析目的
网站、商品、用户的购物行为分析。

二、 分析正文

  1. 数据清洗
    因数据量太大,随机选取了3000个用户的行为日志进行分析。共有304920条行为数据,假定该数据为网站总数据。没有缺失值。为考察异常值,绘制变量5的箱线图如下。

图1 timestamp异常值分析

由图可知timestamp中有异常值,查询发现,数据集中含有129条时间小于11月25日的记录,和50条时间大于12月3日的记录,不符合要求,因此删除此179条记录,得到304741条

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值