案例简介
在天猫,每天都会有数千万的用户通过品牌发现自己喜欢的商品,品牌是连接消费者与商品最重要的纽带。本案例任务就是根据用户在天猫的行为日志,建立用户的品牌偏好,分析用户的购买行为,为预测用户将来一个月内对品牌下商品的购买行为做准备。数据集总共10万多条的行为记录,每条字段含义记录如下:
字 段 | 含义 | 说明 |
---|---|---|
user_id | 用户标记 | 字段加密 |
item_id | 商品标记 | 字段加密 |
behavior_type | 行为 | 点击:0 购买:1 收藏:2 购物车:3 |
item_category | 商品分类标记 | 字段加密 |
time | 时间 | |
location | 位置 |
案例目的
熟悉Linux系统、MySQL、Hadoop、HBase、Sqoop、R、Eclipse等系统和软件的安装和使用;
了解大数据处理的基本流程;
熟悉数据集上传分布式文件系统