RDD Transformation算子分类

处理数据类型为Value型的Transformation算子可以根据RDD变换算子的输入分区与输出分区关系分为以下几种类型:


  • 1)输入分区与输出分区一对一型

    (1)map
    (2)flatMap
    (3)mapPartitions
    (4)glom

  • 2)输入分区与输出分区多对一型

    (1)union
    (2)certesian

  • 3)输入分区与输出分区多对多型

    groupBy

  • 4)输出分区为输入分区子集型

    (1)filter
    (2)distinct
    (3)subtract
    (4)sample
    (5)takeSample

  • 5)还有一种特殊的输入与输出分区一对一的算子类型:Cache型。 Cache算子对RDD分区进行缓存

    (1)cache
    (2)persist

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值