淘宝用户行为分析——通过excel分析

一、需要解决的问题

每日的浏览量,访客量以及时间维度的用户行为分析

二、理解数据

阿里云天池数据:https://tianchi.aliyun.com/dataset/dataDetail?dataId=649
数据集包含了2017年11月25日至2017年12月3日之间的所有行为(行为包括点击、购买、加购、喜欢)。本数据集包含用户数量约100万,商品数量约 400万件,商品类目数量涉及9000多项,所有行为数量约为1亿条。

字段名 说明
用户ID 整数类型,序列化后的用户ID
商品ID 整数类型,序列化后的商品ID
商品类目ID 整数类型,序列化后的商品所属类目ID
行为类型 字符串,枚举类型,包括(‘pv’, ‘buy’, ‘cart’, ‘fav’)
时间戳 行为发生的时间戳

三、数据处理

1.数据抽取

因为数据量大,我们先采用Python,pandas进行读取csv文件,并从中抽取100万条行为数据,再进行excel的分析。

import pandas as pd;
#读取csv文件
data=pd.read_csv(r'D:\download\UserBehavior.csv'
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值