推荐:博主历时三年倾注大量心血创作的《大数据平台架构与原型实现:数据中台建设实战》一书已由知名IT图书品牌电子工业出版社博文视点出版发行,真诚推荐给每一位读者!点击《重磅推荐:建大数据平台太难了!给我发个工程原型吧!》了解图书详情,扫码进入京东手机购书页面!
#概述
Scala的集合类可以从三个维度进行切分:
- 可变与不可变集合(Immutable and mutable collections)
- 静态与延迟加载集合 (Eager and delayed evaluation )
- 串行与并行计算集合(Sequential and parallel evaluation )
关于第一个维度我想我们不需要再介绍了。关于第二维度,是这样解释的, 首先我们来解释一个概念:transformation,集合中有大量的操作都是把一个集合“转换”成另一个集合,比如map,filter等等。而Eager和Delayed集合的区别在于:Eager集合总是立即为元素分配内存,当遇到一个transform动作时,Eager的集合会直接计算并返回结果,而Delayed集合则会尽可能晚的推迟执行,直到必须返回结果时才去执行。这一点和Spark RDD操作中的transformation和action非常类似。
在现有的集合里,只有Stream是Lasy的,所有其他的集合都是静态(Eager)加载的。但是你可以很容易地把一个静态集合转换成lazy的,那就是创建一个view。
#集合类型总览
#Immutable Collection
##Immutable Seq
Seq主要分两大类:indexed sequences和linear sequences,indexed sequences暗示本类集合在随机读取方面有较高的性能(类似数据结构中的数组)。linear sequences暗示本类集合在head和tail操作和顺序遍历上更有优势(类似于数据结构中的双向列表)
在使用Seq时,默认使用的具体类是List, 使用IndexedSeq时默认使用的具体类是Vector.
scala> val seq = Seq(1,2,3)
seq: Seq[Int] = List(1, 2, 3)
scala> val indexedSeq = IndexedSeq(1,2,3)
indexedSeq: IndexedSeq[Int] = Vector(1, 2, 3)
##Immutable Set
##Immutable Map
##Mutable Seq
#如何选择集合类
##各种Immutable Sequence的特性比较
##各种Mutable Sequence的特性比较
##各种Map的特性比较
##各种Set的特性比较
注: 本文类图参考自《Beginning Scala》, 表格参考自《Scala Cookbook》
##相关阅读
Scala之模式匹配(Patterns Matching)
###Scala之Partially Applied Function和Currying
###Scala之偏函数Partial Function
###Scala之Case Class
###Scala之主构造函数
###Scala之隐式转换