大数据项目分享 - 大数据电商用户行为分析 -python 大数据

kooerr

于 2023-10-01 18:03:05 发布

阅读量210

点赞数

文章标签： python 算法

本文链接：https://blog.csdn.net/kooerr/article/details/133467520

版权

本文详细描述了一项基于2014年淘宝APP用户行为的数据分析项目，涵盖了日访问量、用户行为类型、消费行为、复购情况、漏斗流失以及用户与商品种类的关系。通过数据清洗和统计，研究了用户活跃度、付费率和消费模式，为电商推荐系统提供有价值的信息。

摘要由CSDN通过智能技术生成

0 前言

🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。

为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是

🚩 基于大数据的淘宝用户行为分析

🥇学长这里给一个题目综合评分(每项满分5分)

难度系数：3分
工作量：3分
创新点：3分

🧿 选题指导, 项目分享：

https://gitee.com/yaa-dc/warehouse-1/blob/master/python/README.md

一.背景描述

针对项目：淘宝用户分析使用。2014年是阿里巴巴集团移动电商业务快速发展的一年，例如2014双11大促中移动端成交占比达到42.6%，超过240亿元。相比PC时代，移动端网络的访问是随时随地的，具有更丰富的场景数据，比如用户的位置信息、用户访问的时间规律等。

本次大赛以阿里巴巴移动电商平台的真实用户-
商品行为数据为基础，同时提供移动时代特有的位置信息，而参赛队伍则需要通过大数据和算法构面向建移动电子商务的商品推荐模型。希望参赛队伍能够挖掘数据背后丰富的内涵，为移动用户在合适的时间、合适的地点精准推荐合适的内容。

二.项目背景

本数据报告以淘宝app平台为数据集，通过行业的指标对淘宝用户行为进行分析，从而探索淘宝用户的行为模式，具体指标包括：日PV和日UV分析，付费率分析，复购行为分析，漏斗流失分析和用户价值RFM分析。

三.数据来源

丹成学长数据集

四.提出问题

日PV有多少
日UV有多少
付费率情况如何
复购率是多少
漏斗流失情况如何
用户价值情况

五.理解数据

本数据集共有104万条左右数据，数据为淘宝APP2014年11月18日至2014年12月18日的用户行为数据，共计6列字段，列字段分别是：

user_id：用户身份，脱敏

item_id：商品ID，脱敏

behavior_type：用户行为类型（包含点击、收藏、加购物车、支付四种行为，分别用数字1、2、3、4表示）

user_geohash：地理位置

item_category：品类ID（商品所属的品类）

time：用户行为发生的时间

六.数据清洗

import pandas as pd
import numpy as py
%matplotlib inline
import matplotlib.pyplot as plt
import seaborn as sns
data_user = pd.read_csv(‘/home/kesci/input/taobao1920/tianchi_mobile_recommend_train_user.csv’)

6.1缺失值处理

#缺失值处理
missingTotal = data_user.isnull().sum()
missingExist = missingTotal[missingTotal>0]
missingExist = missingExist.sort_values(ascending=False)
print(missingTotal)

user_id 0
item_id 0
behavior_type 0
user_geohash 8334824
item_category 0
time 0
dtype: int64

存在缺失值的是User_geohash，有717785条，不能删除缺失值，因为地理信息在数据集收集过程中做过加密转换，因此对数据集不做处理。

6.2查看数据

print(data_user.head())

最低0.47元/天解锁文章

kooerr

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据项目分享 - 大数据电商用户行为分析 -python 大数据

🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的是🚩基于大数据的淘宝用户行为分析🥇学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：3分🧿。
复制链接

扫一扫