flatmap和map的区别

最新推荐文章于 2024-07-24 09:18:36 发布

YQlakers

最新推荐文章于 2024-07-24 09:18:36 发布

阅读量1.5w

点赞数 1

分类专栏： Spark 文章标签： flatmapmap

Spark 专栏收录该内容

11 篇文章 1 订阅

订阅专栏

map()是将函数用于RDD中的每个元素，将返回值构成新的RDD。

flatmap()是将函数应用于RDD中的每个元素，将返回的迭代器的所有内容构成新的RDD,这样就得到了一个由各列表中的元素组成的RDD,而不是一个列表组成的RDD。

有些拗口，看看例子就明白了。

val rdd = sc.parallelize(List("coffee panda","happy panda","happiest panda party"))

输入

rdd.map(x=>x).collect

结果

res9: Array[String] = Array(coffee panda, happy panda, happiest panda party)

输入

rdd.flatMap(x=>x.split(" ")).collect

结果

res8: Array[String] = Array(coffee, panda, happy, panda, happiest, panda, party)

flatMap说明白就是先map然后再flat，再来看个例子

val rdd1 = sc.parallelize(List(1,2,3,3))

scala> rdd1.map(x=>x+1).collect res10: Array[Int] = Array(2, 3, 4, 4)

scala> rdd1.flatMap(x=>x.to(3)).collect res11: Array[Int] = Array(1, 2, 3, 2, 3, 3, 3)

---------------------------------------------------------------------------------------------------------------------------

点到为止版: flatMap = flatten + map;

深坑版: 就是自函子范畴上的一个协变函子的态射函数与自然变换的组合!

varli=List(1,2,3,4)

varres =li.flatMap(x=>x match {

case 3 => List(3.1,3.2)

case_ =>List(x*2)

})

println(res)

li=List(1,2,3,4)

varres2 =li.map(x=>x match {

case3 =>List(3.1,3.2)

case_ =>x*2

})

println(res2)

//output=>

List(2,4,3.1,3.2,8)

List(2,4,List(3.1,3.2),8)

Programexited.

这个过程就像是先 map, 然后再将 map 出来的这些列表首尾相接 (flatten).

转自：http://blog.csdn.net/u013063153/article/details/53304087

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

YQlakers CSDN认证博客专家 CSDN认证企业博客

码龄9年

37: 原创

18万+: 周排名

215万+: 总排名

22万+: 访问

: 等级

2407: 积分

33: 粉丝

54: 获赞

10: 评论

159: 收藏

私信

关注

热门文章

分类专栏

数据挖掘 2篇
python 1篇
python爬虫 1篇
java 20篇
Offer 5篇
TCP握手 2篇
Linux 4篇
JVM 1篇
Hadoop 9篇
java open
java opencsv 1篇
Mahout 2篇
Mysql 4篇
Hive 3篇
Zookeeper 3篇
Sqoop 1篇
Spark 11篇
kafka 2篇
机器学习 2篇
算法
数据结构 1篇
网络协议 2篇
HBase 2篇

最新评论

Hive与传统数据库的区别
亚楠18012043: 更新、事务和索引都是传统数据库最重要的特性，但是，直到最近，Hive也没有考虑支持这些特性 --对我有用，感谢作者的分享
Java的内存回收机制详解
时光无声_l: 感谢博主的分享，这是我看了这么多资料一来，最能理解的一篇
hadoop上的两种运行mapreduce程序的方法
YQlakers 回复氟化氢-xurb: 你先把平台搭起来再说分析的问题，这个工具并不难主要是你的分析部分算法但是我觉得你们老师让你分析的数据也不会太大用python或者java程序都能解决
hadoop上的两种运行mapreduce程序的方法
氟化氢-xurb 回复 YQlakers: 我现在有一大堆数据要分析，是我老师给我的，他建议我用Hadoop的MapReduce来统计分析，但我不是计算机专业的学生呀，所以我来csdnh找大牛，现在有点崩，嘿嘿嘿
hadoop上的两种运行mapreduce程序的方法
YQlakers: 你直接在这里描述你的问题哈可能不一定能解答你的疑惑我已经丢了一年了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。