一:分析背景
近年来电商行业发展迅猛,发展的模式也从最开始粗糙的供给结构开始向精细化电商发展。我国政策也指出: 促进电子商务发展是推进供给侧结构性改革重要的途径。因此分析用户的行为,可打造爆款商品,爆款孵化的核心不是一味地营销,而是基于爆款的推广能力,对用户需求有精准的把控,且有能力在最短的时间内满足用户需求。完善推送机制,使得电商的“供”与用户的“需”进一步契合。本文将对电商用户的行为进行分析。
二:理解数据
数据集来源:阿里巴巴天池User Behavior Data from Taobao for Recommendation-数据集-阿里云天池tianchi.aliyun.com
本数据集(UserBehavior.csv)包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成。
数据集中有近100万条数据,本篇分析报告只导入10万条数据。
三:清洗数据处理字段名。在navicat中导入数据,数据源中列名默认为第一条数据,为了便于分析,我们重新设置列名,并设置联合主键如下,确保无重复值。勾选“不是NULL”确保无缺失值。
接下来我们验证确实无缺失值。