首先用sparkStreaming将数据转换(window操作)(每个一段时间统计最近一个小时的操作)
使用sparkSQL(row_number开窗函数)来进行分组top3热门商品统计
我们的开窗函数最好用hiveContext来创建,不要用SQLContext来创建
首先用sparkStreaming将数据转换(window操作)(每个一段时间统计最近一个小时的操作)
使用sparkSQL(row_number开窗函数)来进行分组top3热门商品统计
我们的开窗函数最好用hiveContext来创建,不要用SQLContext来创建