容器深入研究
一、完整的容器分类法
以下是集合类库更完备的图,包括抽象类和遗留构件(不包括Queue的实现):
虚线表示abstract类。
二、填充容器
fill()方法和addAll()方法。
一种Generator:事实上所有的Collection子类型都有一个接收另一个Collection对象的构造器,用所接收的Collection对象中的元素来填充新的容器。
Map生成器:Map适配器可以使用各种不同的Generator,Iterator和常量值的组合来填充Map初始化对象。
使用Abstract类:一种解决方式是创建定制的Collection和Map实现。
三、Collection的功能方法
Map不是继承Collection。
四、可选操作
执行各种不同的添加和移除的方法在Collection接口中都是可选操作。这意味着实现类并不需要为这些方法提供功能定义。
容器应易学易用。未获支持的操作是一种特例,可以延迟到需要时再实现。为了使这种方式能够工作:
1,UnsupportedOperationException必须是一种罕见事件。
2,如果一个操作是未获支持的,那么在实现接口的时候可能就会导致UnsupportedOperationException异常。
值得注意的是,未获支持的操作只有在运行时才能探测到,因此它们表示动态类型检查。
未获支持的操作,都来源于背后由固定尺寸的数据结构支持的容器。
五、List的功能方法
基本的List很容易使用,大多数时候只是调用add()添加对象,使用get()一次取出一个元素,以及调用iterator()获取用于该序列的Iterator。
六、Set和存储顺序
Set的每个元素都必须是唯一的,因为Set不保存重复元素。加入Set的元素必须定义equals()方法以确保对象的唯一性。Set和Collection有完全一样的接口。Set接口不保证维护元素的次序。
HashSet 为了快速查找设计的Set,存入HashSet的元素必须定义HashCode().
TreeSet 保持次序的Set,底层为树结构。使用它可以从Set中提取有序的序列。元素必须实现Comparable接口。
LinkedHashSet 具有HashSet的查询速度,且内部使用链表维护元素的顺序。于是在使用迭代器遍历Set时,结果会按元素插入的次序显示。元素也必须定义hashCode()方法。
SortedSet中的元素可以保证处于排序状态,这使得它可以通过在SortedSet接口中的下列方法提供附加功能。
七,队列
除了并发应用,Queue在Java SE5中仅有的两个实现是LinkedList和PriorityQueue,他们的差异在于排序行为而不是性能。
优先级队列PriorityQueue,排序顺序是通过实现Comparable进行控制的。双向队列就像是一个队列,但是你可以在任何一端添加或移除元素。LinkedList包含支持双向队列的方法,但是JAVA标准类库中没有任何显式的用于双向队列的接口。
八、理解Map
Map的集中基本实现包HashMap,TreeMap,LinkedHashMap,WeakHashMap,ConcurrentHashMap,IdentityHashMap,它们都有相同的基本接口Map,但是行为特征各不相同,这表现在效率,键值对的保存及呈现次序,对象的保存周期,映射表如何在多线程程序中工作和判定键等价的策略等方面。
性能是映射表中一个重要问题,HashMap使用了特殊的值,称作散列码,来取代对键的缓慢搜索。hashCode()是根类Object中的方法,因此所有的Java对象都能产生散列码。
SortedMap(TreeMap是其现阶段唯一实现),可以确保键处于排序状态。为了提高速度,LinkedHashMap散列化所有的元素,遍历键值对时,以元素的插入顺序返回键值对。
九、散列与散列码
默认的Object.equals()只是比较对象的地址。散列结构要覆盖hashCode()和equals()方法可以正确处理散列数据结构的键,能够完全确定对象的身份。
线性查询是最慢的查询方式,散列的价值在于速度,散列使得查询得以快速进行。
数组并不保存键本身,而是通过键对象生成一个数字,将其作为数组的下标,这个数字就是散列码。查询一个值的过程首先就按计算散列码,然后使用散列码查询数组。
十、选择接口的不同实现
尽管容器只有四种:Map,List,Set和Queue,但是每种接口都有不止一个实现版本。
对于LinkedList中的插入和移除代价相当低廉,比呢且不随列表尺寸发生变化,但是对于ArrayList,插入和删除的操作代价特别高昂,并且其代价将随表尺寸的增加而增加。
避免使用Vector,它只存在于支持遗留代码的类库中。CopyOnWriteArrayList是List的一个特殊实现,专门用于并发编程。
HashSet的性能总体上比TreeSet好特别是添加和查询元素时。TreeSet存在的唯一原因是它可以维持元素的排序状态。对于插入操作,LinkedHashSet比HashSet的代价更高,这是由维护链表所带来额外开销造成的。
除了IdentityHashMap,所有的Map实现插入操作都会随着Map尺寸变大而明显变慢,但是查找的代价通常比插入要小的多。
HashMap性能大体上与HashMap相当。因为HashMap是用来替代HashTable的,它们是用了相同的底层存储和查找机制。
TreeMap通常比HashMap要慢,TreeMap是一种创建有序列表的方式。树的行为是:总是保证有序,并且不必进行特殊的排序。
LinkedHashMap在插入时比HashMap慢一点,因为它维护散列数据结构的同时还要维护链表。正是由于列表,使得迭代速度更快。
十一、实用方法
Java中有大量用于容器卓越的使用方法,它们被表示为java.util.Collection类内部的静态方法。
Collection类有办法能够自动同步整个容器。
快速报错:Java容器有一种保护机制,能够防止多个进程同时修改同一个容器的内容。如一个进程迭代容器数据,一个进程删除增加数据,就会初夏你问题。
十二、持有引用
java.lang.ref类库包括了一组类,这些类为垃圾回收提供了更大的灵活用。当存在可能会耗尽内存的大对象的时候,这些类显得特别有用,有三个继承自抽象类Reference的类:SoftReference,WeakReference和PhantomReference。当垃圾回收器正在考察的对象只能通过某个Reference对象才可获得时,上述这些不同的派生类为垃圾回收器提供了不同级别的间接性指示。
十三、Java1.0/1.1的容器
写新的程序时,决不应该使用旧的容器。
Vector和Enumeration。
HashTable,Stack,BitSet
十四、总结
容器类库对于面向对象语言来说是重要的类库,大多数编程工作对容器的使用比对其他类库中的构架都要多。