spark摘星之路(2)--Scala基础(3)

本文是Spark系列的Scala基础篇,主要介绍了Map集合操作、集合类中的map、flatMap和filter函数。Map类似Python字典,map函数用于对集合元素批量操作,flatMap则会在转换后合并结果,filter则用于批量筛选满足条件的元素。文章通过实例详细解释了三者的区别和使用方法。
摘要由CSDN通过智能技术生成

1.Map集合操作

这里的Map是一种数据类型,类似于python中的字典,java集合工具中的hashmap等。

map是一种key-value的形式,用关键字Map来定义,key值使用->符号来关联value,代码如下:

scala> val zhangsan = Map("stu_id"->"2018xxxx","sex"->"man")
zhangsan: scala.collection.immutable.Map[String,String] = Map(stu_id -> 2018xxxx, sex -> man)

可以通过key值快速找到所对应的value值,代码如下:

scala> zhangsan("stu_id")
res0: String = 2018xxxx

2.集合类常用函数

上文中,所讲的高阶函数就是一种能够使用函数作为形参的函数。对于Scala常用的数据结构,也就是集合类中的元素,都可以使用集合类中的高阶函数进行处理,这些高阶函数也是一些在spark中常见的transformation算子。

2.1map函数

这里的map是函数,而不是数据结构,使用map关键字(ps:map是小写的)。

它能够将定义的数据结构中所有的元素都进行批量的相同操作,返回和原来数据结构中元素个数相同的一个集合。

在sparkRDD中,使用map函数是将一个RDD通过函数转换成另一个RDD。

具体代码如下:

scala&g
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值