- 博客(1)
- 资源 (5)
- 收藏
- 关注
原创 day80sparkSQL网站搜索综合实例
目的:找出搜索平台上用户明天搜索排名前五名的产品 1、原始的ETL过滤数据后产生目标数据 广播的原理,过滤是发生在work 2、对过滤后的目标数据进行指定条件的查询,查询条件又可能非常复杂(进行广播(广播过滤条件)),进行RDD的filter的算子; 3、对于商品时分为种类的,我们在得出最终结果之前,首先会基于商品UV(对于用户访问商品的PV) 此时我们要对商品进行UV计算的话,必须
2016-08-30 01:06:10 607
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人