spark算子map reduce小案例

1.RDD两种操作方式介绍

1.1 转换操作(Transformation)

转换操作(Transformation)使用了链式调用的设计模式,对一个RDD计算之后,转换为另一个RDD,然后这个RDD又可以经过转换,转换为另一个RDD。这个过程是分布式的,它 必须等待行动操作(Action)完成后,才真正的触发Spark提交作业,开始执行计算。

1.2行动操作(Action)

行动操作Action是和转换操作相对应的一种操作,在Spark程序运行中,每调用一次Action操作,都会触发一次Spark的作业提交,并 返回相应的结果

2.转换操作map()介绍

map函数定义如下:
def
map[U](f: (T) ⇒ U)(implicit arg0: ClassTag[U]): RDD[U]
 Permalink
Return a new RDD by applying a function to all elements of this RDD.
map方法将原来的RDD中类型为T的元素,通过用户自定义的函数f按照一对一地映射为U类型的元素。函数f可以是简单的加减,也可以是复杂的将一元组转换为二元组等等。
 val rdd1 = sc.parallelize(List(1,2,3,4))
 val maprdd1 = rdd1
  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值