给定数据:
orders表:

product表:

priors表:

实现以下业务需求:

1.统计product被购买的数量:
val productCnt = priors.groupBy("product_id").count()
2..统计product 被reordered的数量(再次购买)
product_id做group by(聚合),统计一下sum(reorder)的值
1)priors
.selectExpr("product_id","cast(reordered
本文介绍了如何使用Spark SQL进行产品购买数量统计、重新购买次数及比率计算,以及用户购买行为分析,包括用户平均订单间隔、总订单数、商品去重集合、总商品数量和平均每个订单商品数。
给定数据:
orders表:

product表:

priors表:

实现以下业务需求:

val productCnt = priors.groupBy("product_id").count()
product_id做group by(聚合),统计一下sum(reorder)的值
1)priors
.selectExpr("product_id","cast(reordered
1084
3865
733
826
1808

被折叠的 条评论
为什么被折叠?