Spark RDD transformation操作

Spark RDD transformation操作

1、创建RDD

val nums =sc.parallelize(List(1,2,3))
nums: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[2] at parallelize at <console>:21


2、将RDD转换为新的RDD 结果为(1,4,9)

val squares = nums.map(x =>x*x)
squares: org.apache.spark.rdd.RDD[Int] = MapPartitionsRDD[3] at map at <console>:23


3、过滤RDD,生成新的RDD运行结果为4

val even =squares.filter(_%2==0)
even: org.apache.spark.rdd.RDD[Int] = MapPartitionsRDD[4] at filter at <console>:25
val result =squares.filter(_%2==0).collect
result: Array[Int] = Array(4)


4、 val   a  = nums.flatMap(x =>1 to x) 运行结果为  //将函数运用到每一个函数,然后扁平化操作

a: Array[Int] = Array(1, 1, 2, 1, 2, 3)

这是怎么来的呢

1=>1

2=>1,2

3=>1,2,3

然后右边相加


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值