【spark-Spark编程-笔记3】join、zip、combineByKey、计算学生平均成绩

目录

使用join连接两个RDD

用zip组合两个RDD

使用combineByKey合并相同键的值

计算学生平均成绩


使用join连接两个RDD

选取rdd1与rdd2共有的键进行连接,

因为k3键只在rdd1中,rdd2中没有k3,所以k3不进行连接

同理:

 

用zip组合两个RDD

这里要求两个RDD的partition(分区)数量以及元素数量都相同,否则会抛出异常(两个一维)

同理:一个一维,一个二维连接

使用combineByKey合并相同键的值

combineByKey用于将相同键的数据聚合,并且允许返回类型与输入数据类型不同的返回值

string类型:

int类型:

计算学生平均成绩

1、提取两个成绩表中的学号和成绩

2、将两个表进行合并

3、将两个表中相同学号的成绩进行相加,并统计科目数量(2)

4、求平均成绩

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值