spark算子map reduce小案例

本文介绍了RDD的两种操作方式——转换和行动操作,详细讲解了map和reduce的用法,并提供了完整的mapAndReduce示例代码。通过实例展示了如何使用map和reduce计算平均值,鼓励读者实践和探索更多可能的方法。
摘要由CSDN通过智能技术生成

1.RDD两种操作方式介绍

1.1 转换操作(Transformation)

转换操作(Transformation)使用了链式调用的设计模式,对一个RDD计算之后,转换为另一个RDD,然后这个RDD又可以经过转换,转换为另一个RDD。这个过程是分布式的,它 必须等待行动操作(Action)完成后,才真正的触发Spark提交作业,开始执行计算。

1.2行动操作(Action)

行动操作Action是和转换操作相对应的一种操作,在Spark程序运行中,每调用一次Action操作,都会触发一次Spark的作业提交,并 返回相应的结果

2.转换操作map()介绍

map函数定义如下:
def
map[U](f: (T) ⇒ U)(implicit arg0: ClassTag[U]): RDD[U]
 Permalink
Return a new RDD by applying a function to all elements of this RDD.
map方法将原来的RDD中类型为T的元素,通过用户自定义的函数f按照一对一地映射为U类型的元素。函数f可以是简单的加减,也可以是复杂的将一元组转换为二元组等等。
 val rdd1 = sc.parallelize(List(1,2,3,4))
 val maprdd1 = rdd1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值