spark摘星之路(2)--Scala基础(3)

最新推荐文章于 2020-12-31 20:31:57 发布

彩笺传翠墨

最新推荐文章于 2020-12-31 20:31:57 发布

阅读量752

点赞数

分类专栏： Spark摘星之路

本文链接：https://blog.csdn.net/wi0pdr88/article/details/82532581

版权

本文是Spark系列的Scala基础篇，主要介绍了Map集合操作、集合类中的map、flatMap和filter函数。Map类似Python字典，map函数用于对集合元素批量操作，flatMap则会在转换后合并结果，filter则用于批量筛选满足条件的元素。文章通过实例详细解释了三者的区别和使用方法。

摘要由CSDN通过智能技术生成

1.Map集合操作

这里的Map是一种数据类型，类似于python中的字典，java集合工具中的hashmap等。

map是一种key-value的形式，用关键字Map来定义,key值使用->符号来关联value，代码如下：

scala> val zhangsan = Map("stu_id"->"2018xxxx","sex"->"man")
zhangsan: scala.collection.immutable.Map[String,String] = Map(stu_id -> 2018xxxx, sex -> man)

可以通过key值快速找到所对应的value值，代码如下：

scala> zhangsan("stu_id")
res0: String = 2018xxxx

2.集合类常用函数

上文中，所讲的高阶函数就是一种能够使用函数作为形参的函数。对于Scala常用的数据结构，也就是集合类中的元素，都可以使用集合类中的高阶函数进行处理，这些高阶函数也是一些在spark中常见的transformation算子。

2.1map函数

这里的map是函数，而不是数据结构，使用map关键字(ps:map是小写的)。

它能够将定义的数据结构中所有的元素都进行批量的相同操作，返回和原来数据结构中元素个数相同的一个集合。

在sparkRDD中，使用map函数是将一个RDD通过函数转换成另一个RDD。

具体代码如下：

scala&g

最低0.47元/天解锁文章

彩笺传翠墨

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark摘星之路(2)--Scala基础(3)

1.Map集合操作这里的Map是一种数据类型，类似于python中的字典，java集合工具中的hashmap等。map是一种key-value的形式，用关键字Map来定义,key值使用-&gt;符号来关联value，代码如下：scala&gt; val zhangsan = Map("stu_id"-&gt;"2018xxxx","sex"-&gt;"man")zhangsan:
复制链接

扫一扫