hadoop重命名文件_Hadoop实践购物网站用户行为分析

该案例通过用户在天猫的行为日志,分析用户的品牌偏好和购买行为,涉及Linux、MySQL、Hadoop、HBase、Sqoop、R、Eclipse等工具。任务包括数据上传、MapReduce处理、结果可视化等,分析用户购买的商品数量分布和TOP10热销商品等。
摘要由CSDN通过智能技术生成

案例简介

在天猫,每天都会有数千万的用户通过品牌发现自己喜欢的商品,品牌是连接消费者与商品最重要的纽带。本案例任务就是根据用户在天猫的行为日志,建立用户的品牌偏好,分析用户的购买行为,为预测用户将来一个月内对品牌下商品的购买行为做准备。数据集总共10万多条的行为记录,每条字段含义记录如下:

字 段 含义 说明
user_id 用户标记 字段加密
item_id 商品标记 字段加密
behavior_type 行为 点击:0 购买:1 收藏:2 购物车:3
item_category 商品分类标记 字段加密
time 时间
location 位置
案例目的
  1. 熟悉Linux系统、MySQL、Hadoop、HBase、Sqoop、R、Eclipse等系统和软件的安装和使用;

  2. 了解大数据处理的基本流程;

  3. 熟悉数据集上传分布式文件系统

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值