spark RDD常用算子介绍

最新推荐文章于 2024-05-28 22:46:39 发布

only111

最新推荐文章于 2024-05-28 22:46:39 发布

阅读量700

点赞数

分类专栏： spark

本文链接：https://blog.csdn.net/qa38113202/article/details/51679242

版权

spark 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

package com.cn.RDD

import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import org.apache.spark.SparkContext._
import org.apache.spark.streaming.StreamingContext
import org.apache.spark.streaming.Seconds

//本地测试环境
object RDDtest {

def main(args: Array[String]){
val conf = new SparkConf()
conf.setAppName("test")
conf.setMaster("local")
val sc = new SparkContext(conf)

val ssc = new StreamingContext(sc, Seconds(1))

//value类型算子
//first 取RDD中第一个元素
/* val rdd=sc.makeRDD(Array(("aa",1),("bb",1),("bb",1),("cc",1)))
println(rdd.first)*/

//reduce RDD元素累加
/*val rdd=sc.makeRDD(Array(1,2,3,4,5,6))
println(rdd.reduce(_+_))*/

//top 降序排列 takeOrdered升序排列
val rdd=sc.makeRDD(1 to 10)
rdd.top(2).foreach(println _)
rdd.takeOrdered(2).foreach(println _)

//lookup 根据指定的key去获取value

//foreach 作用与每一个函数

//map mapPartitions
//map作用于所有元素 mapPartitions作用与分区


//foreach foreachPartition
//foreach 作用于每个元素 foreachPartition作用于每个分区
}

}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

only111

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark RDD常用算子介绍

package com.cn.RDDimport org.apache.spark.SparkConfimport org.apache.spark.SparkContextimport org.apache.spark.SparkContext._import org.apache.spark.streaming.StreamingContextimport org.
复制链接

扫一扫