1. 统计用户收藏的商品数量
格式:用户Id 商品Id 收藏日期
1.1 统计用户收藏数据中,每个用户收藏商品的数量。
1.2 统计用户收藏数据中都有哪些商品被收藏(去重)。
2. 查询用户购买的商品
orders表(订单id, 订单号, 买家ID, 下单日期)
order_items表(明细ID, 订单ID , 商品ID)
查询在当天该电商网站,都有哪些用户购买了什么商品。
对rdd1和rdd2进行map映射,得出计算需要的两列数据
将rdd11以及rdd22中的数据,根据Key值进行Join,输出结果