分析背景
淘宝网,是全球最受欢迎的网购零售平台之一,拥有近5亿的注册用户数,每天有超过6千万的固定访客,同时每天的在线商品数已经超过了8亿件,平均每分钟售出4.8万件商品。作为电商行业的标杆,淘宝网的用户行为数据,一定程度上反映了用户的购买行为规律。本项目利用。MySQL对淘宝用户行为数据进行分析,探索不同用户的消费习惯,结合店铺营销策略,以实现精准化运营,减少运营成本,增加店铺营收。
说明:数据集来自互联网,如有侵权,请联系删除,谢谢
分析目标与思路
探索目标
每日不同时段流量走势,质量如何?用户行为转化情况怎样?如何提高留存、增加复购?如何判断高价值用户,针对不同用户如何进行个性化营销?
分析思路
- 流量指标分析:对比每日每小时的PV(访问量)、UV(访客数)、平均访问量(PV/UV),在不同时间发布不同的营销活动,寻找更优质的拉新渠道。
- 行为转化分析:统计用户不同行为的转化情况,简化交易流程,提高转化率。
- 产品贡献定量分析:根据产品贡献,调整产品结构,选定营销主题。
- 用户价值分析:对用户进行价值分层,针对不同层级的用户制定不同的营销策略。
数据准备
数据获取
数据集来源于淘宝APP移动端,2014年11月18日至2014年12月18日的用户行为数据。
数据理解
表中有7个字段:用户ID、商品ID、商品类目ID、用户行为类型、用户所在地理位置、用户行为时间、金额,一共有12256905条数据。限于电脑性能,仅提取前1048575条记录用作分析。
字段名 | 字段描述 | 数据类型 |
---|---|---|
user_id | 用户ID | INT |
item_id | 商品ID | INT |
item_category | 商品类目ID | INT |
behavior_type | 用户行为类别 | VARCHAR(10) |
user_geohash | 用户地理位置 | VARCHAR(10) |
times | 行为时间 | DATETIME |
amount | 金额 | DECIMAL(5,2) |
pv:点击,用户访问商品详情页。必须是商品详情页的流量,淘宝网首页、搜索结果页等页面的点击流量不算在内。
fav:收藏,用户将商品加入收藏夹,便于下次访问。收藏夹中的商品不可直接购买,必须再次发生“点击”行为后,在商品详情页方可购买。
cart:加购,用户将商品添加到购物车。用户可从购物车直接购买商品,无须再次产生“点击”行为。
buy:下单,用户点击提交订单购买商品。
数据清洗
建表导数:
create database taobao;
use taobao;