Linux 下Spark shell 编程实例

1. 统计用户收藏的商品数量

格式:用户Id 商品Id 收藏日期
在这里插入图片描述

1.1 统计用户收藏数据中,每个用户收藏商品的数量。

在这里插入图片描述

1.2 统计用户收藏数据中都有哪些商品被收藏(去重)。

在这里插入图片描述

2. 查询用户购买的商品

orders表(订单id, 订单号, 买家ID, 下单日期)
在这里插入图片描述

order_items表(明细ID, 订单ID , 商品ID)
在这里插入图片描述
查询在当天该电商网站,都有哪些用户购买了什么商品。
对rdd1和rdd2进行map映射,得出计算需要的两列数据
将rdd11以及rdd22中的数据,根据Key值进行Join,输出结果
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值