一、任务
1.1、商品零售购物篮分析
现代商品种类繁多,顾客往往会由于需要购买的商品众多而变得疲于选择,且顾客并不会因为商品选择丰富而选择购买更多的商品。
繁杂的选购过程往往会给顾客疲惫的购物体验。
1.2、了解顾客需求
1.3、任务目标
- 创建订单表和物品分类表
- 统计顾客数量和商品购买数量
- 统计各类型商品的购买情况
- 统计所有商品中排名前20的热销商品
- 统计不同类别商品中排名前10的热销商品
- 将同一个客户的订单整合为一列并写入HDFS
二、配置Hive的java开发环境
2.1、搭建开发环境
- 在Eclipse中创建Java工程
- 导入Hive安装包下lib目录中所有的Jar包
- 导入Hadoop安装包下
share\hadoop\common\lib
、share\hadoop\common
、share\hadoop\hdfs\lib
、share\hadoop\hdfs
、share\hadoop\mapreduce
、share\hadoop\mapreduce\lib
的Jar包
启动远程服务:
- 在L