spark的translate和action

本文详细介绍了Spark中的translate和action操作。首先,讲解了translate在处理单个RDD时的应用,接着阐述了如何在两个RDD间进行操作。然后,讨论了action的作用,帮助读者深入理解Spark的数据处理流程。
摘要由CSDN通过智能技术生成

spark的translate和action

之前对spark的一直进行学习和操作,最近准备系统的学习一下的。对于translate和action有一定了解,但是不是很全面。所以在这篇博客中整理一下的。

translate

对于一个rdd的操作

函数名 目的 示例 结果 备注
map() 将函数应用于RDD中的每个元素,将返回值构成新的RDD rdd.map(lambd x:x+1) {2,3,4,5} 和python的基本用法差不多
flatmap() 将函数应用于RDD中的每个元素,将返回的迭代器的所有内容构成新的RDD。通常用来切分单词 rdd.flatMap(lambda x:x.split(“,”)) {1,2,3,2,3,3,3}
filter() 返回一个由通过传给filter()的函数的元素组成的RDD rdd.filter(x=>x!=1)
和python的算法很像
distinct() 去重 rdd.distinct() {1,2,3} ..
sample(withReplacement,fraction,[seed]) 对RDD采样,以及是否替换,第一个参数是是否
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值