1.Map集合操作
这里的Map是一种数据类型,类似于python中的字典,java集合工具中的hashmap等。
map是一种key-value的形式,用关键字Map来定义,key值使用->符号来关联value,代码如下:
scala> val zhangsan = Map("stu_id"->"2018xxxx","sex"->"man")
zhangsan: scala.collection.immutable.Map[String,String] = Map(stu_id -> 2018xxxx, sex -> man)
可以通过key值快速找到所对应的value值,代码如下:
scala> zhangsan("stu_id")
res0: String = 2018xxxx
2.集合类常用函数
上文中,所讲的高阶函数就是一种能够使用函数作为形参的函数。对于Scala常用的数据结构,也就是集合类中的元素,都可以使用集合类中的高阶函数进行处理,这些高阶函数也是一些在spark中常见的transformation算子。
2.1map函数
这里的map是函数,而不是数据结构,使用map关键字(ps:map是小写的)。
它能够将定义的数据结构中所有的元素都进行批量的相同操作,返回和原来数据结构中元素个数相同的一个集合。
在sparkRDD中,使用map函数是将一个RDD通过函数转换成另一个RDD。
具体代码如下:
scala&g