157、Spark内核原理进阶之join算子内部实现原理

13274599-f96e7ed2833781a5.png

join.png

 

join算子的原理

  1. cogroup,聚合两个rdd的key
  2. flatMap,聚合后的每条数据,都可能返回多条数据
    将每个key对应的两个集合的所有元素,做了一个笛卡尔积
发布了349 篇原创文章 · 获赞 23 · 访问量 31万+
展开阅读全文
评论将由博主筛选后显示,对所有人可见 | 还能输入1000个字符

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 大白 设计师: CSDN官方博客

分享到微信朋友圈

×

扫一扫,手机浏览