全面接触Java集合框架


Java集合框架
(1)一、概述
数据结构对程序设计有着深远的影响,在面向过程的C语言中,数据库结构用struct来描述,而在面向对象的编程中,数据结构是用类来描述的,并且包含有对该数据结构操作的方法。
在Java语言中,Java语言的设计者对常用的数据结构和算法做了一些规范(接口)和实现(具体实现接口的类)。所有抽象出来的数据结构和操作(算法)统称为Java集合框架(Java Collection Framework)。
Java程序员在具体应用时,不必考虑数据结构和算法实现细节,只需要用这些类创建出来一些对象,然后直接应用就可以了。这样就大大提高了编程效率。
二、集合框架的层次结构
Collection是集合接口
|————Set子接口:无序,不允许重复。
|————List子接口:有序,可以有重复元素。
区别:Collections是集合类
Set和List对比:
Set:检索元素效率低下,删除和插入效率高,插入和删除不会引起元素位置改变。
List:和数组类似,List可以动态增长,查找元素效率高,插入删除元素效率低,因为会引起其他元素位置改变。
Set和List具体子类:
Set
|————HashSet:以哈希表的形式存放元素,插入删除速度很快。
List
|————ArrayList:动态数组
|————LinkedList:链表、队列、堆栈。
Array和java.util.Vector
Vector是一种老的动态数组,是线程同步的,效率很低,一般不赞成使用。
三、Iterator迭代器(接口)
Iterator是获取集合中元素的过程,实际上帮助获取集合中的元素。
迭代器代替了 Java Collections Framework 中的 Enumeration。迭代器与枚举有两点不同:
迭代器允许调用方利用定义良好的语义在迭代期间从迭代器所指向的集合移除元素。
方法名称得到了改进。
Iterator仅有一个子接口ListIterator,是列表迭代器,允许程序员按任一方向遍历列表、迭代期间修改列表,并获得迭代器在列表中的当前位置。ListIterator 没有当前元素;它的光标位置 始终位于调用 previous() 所返回的元素和调用 next() 所返回的元素之间。在长度为 n 的列表中,有 n+1 个有效的索引值,从 0 到 n(包含)。
四、集合框架之外的Map接口
Map将键映射到值的对象。一个映射不能包含重复的键;每个键最多只能映射一个值。
Map接口是Dictionary(字典)抽象类的替代品。
Map 接口提供三种collection 视图,允许以键集、值集合或键-值映射关系集的形式查看某个映射的内容。映射的顺序 定义为迭代器在映射的 collection 视图中返回其元素的顺序。某些映射实现可明确保证其顺序,如 TreeMap 类;某些映射实现则不保证顺序,如 HashMap 类。
有两个常见的已实现的子类:
HashMap:基于哈希表的 Map 接口的实现。此实现提供所有可选的映射操作,并允许使用 null 值和 null 键。(除了不同步和允许使用 null 之外,HashMap 类与 Hashtable 大致相同。)此类不保证映射的顺序,特别是它不保证该顺序恒久不变。
TreeMap:它实现SortedMap 接口的基于红黑树的实现。此类保证了映射按照升序顺序排列关键字,根据使用的构造方法不同,可能会按照键的类的自然顺序 进行排序(参见 Comparable),或者按照创建时所提供的比较器进行排序。
Hashtable:此类实现一个哈希表,该哈希表将键映射到相应的值。任何非 null 对象都可以用作键或值。
五、线程安全类
在集合框架中,有些类是线程安全的,这些都是JDK1.1中的出现的。在JDK1.2之后,就出现许许多多非线程安全的类。
下面是这些线程安全的同步的类:
Vector:就比ArrayList多了个同步化机制(线程安全)。
Statck:堆栈类,先进后出。
Hashtable:就比HashMap多了个线程安全。
Enumeration:枚举,相当于迭代器。
除了这些之外,其他的都是非线程安全的类和接口。
线程安全的类其方法是同步的,每次只能一个访问。是重量级对象,效率较低。对于非线程安全的类和接口,在多线程中需要程序员自己处理线程安全问题。
六、其他一些接口和类介绍
Dictionary和Hashtable类:
Dictionary提供键值映射的功能,是个抽象类。一般使用它的子类HashTable类。遍历Hashtable类要用到枚举。
Properties类
Properties 继承于 Hashtable,Properties 类表示了一个持久的属性集。Properties 可保存在流中或从流中加载。属性列表中每个键及其对应值都是一个字符串。一般可以通过读取properties配置文件来填充Properties对象。

(2)浅谈JAVA集合框架

Java提供了数种持有对象的方式,包括语言内置的Array,还有就是utilities中提供的容器类(Container classes),又称群集类(collection classes)。集合在java中非常重要,在讨论之前,先来看几个面试中的经典问题。 
1 Collection 和 Collections的区别。 
2 List, Set, Map是否继承自Collection接口。 
3 ArrayList和Vector的区别。 
4 HashMap和Hashtable的区别。

答案

Collection 和 Collections的区别。

Collections是个java.util下的类,它包含有各种有关集合操作的静态方法。

Collection是个java.util下的接口,它是各种集合结构的父接口

List, Set, Map是否继承自Collection接口? List,Set是 Map不是

ArrayList和Vector的区别。 
一.同步性:Vector是线程安全的,也就是说是同步的,而ArrayList是线程序不安全的,不是同步的 
二.数据增长:当需要增长时,Vector默认增长为原来一培,而ArrayList却是原来的一半

HashMap和Hashtable的区别 
一.历史原因:Hashtable是基于陈旧的Dictionary类的,HashMap是Java 1.2引进的Map接口的一个实现

二.同步性:Hashtable是线程安全的,也就是说是同步的,而HashMap是线程序不安全的,不是同步的

三.值:只有HashMap可以让你将空值作为一个表的条目的key或value 

 

集合Collection接口

--Collection 是任何对象组,元素各自独立,通常拥有相同的套用规则。Set List由它派生。

基本操作 增加元素add(Object obj); addAll(Collection c);

删除元素 remove(Object obj); removeAll(Collection c);

求交集 retainAll(Collection c);

删除元素 remove(Object obj); removeAll(Collection c);

求交集 retainAll(Collection c);

访问/遍历集合元素的好办法是使用Iterator接口(迭代器用于取代Enumeration)

Public interface Iterator

   Public Boolean hasNext(}


   Public Object next(}; 

  Public void remove(}; 

}

集set 
--没有重复项目的集合

有三种特定类型的集可用

HashSet-基于散列表的集,加进散列表的元素要实现hashCode()方法

LinkedHashSet-对集迭代时,按增加顺序返回元素

TreeSet-基于(平衡)树的数据结构

清单List

--位置性集合。加进清单的元素可以加在清单中特定位置或加到末尾

有两个特定版本

ArrayList(数组表)-类似于Vector,都用于缩放数组维护集合。区别:

一.同步性:Vector是线程安全的,也就是说是同步的,而ArrayList是线程序不安全的,不是同步的 
二.数据增长:当需要增长时,Vector默认增长为原来一培,而ArrayList却是原来的一半

LinkedList(链表)-是双向链表,每个节点都有两个指针指向上一节点和下一节点。

用在FIFO,用addList()加入元素 removeFirst()删除元素
用在FILO,用addFirst()/removeLast()

ListIterator提供双向遍历next() previous(),可删除、替换、增加元素

映射表Map

--用于关键字/数值对,像个Dictionary

处理Map的三种集合

关键字集KeySet()

数值集value()

项目集enrySet()

四个具体版本

HashMap-散列表的通用映射表

LinkedHashMap-扩展HashMap,对返回集合迭代时,维护插入顺序

WeakHashMap-基于弱引用散列表的映射表,如果不保持映射表外的关键字的引用,则内存回收程序会回收它

TreeMap-基于平衡树的映射表

HashMap-散列表的通用映射表

LinkedHashMap-扩展HashMap,对返回集合迭代时,维护插入顺序

WeakHashMap-基于弱引用散列表的映射表,如果不保持映射表外的关键字的引用,则内存回收程序会回收它

TreeMap-基于平衡树的映射表 
Collections类,用于同步集合,还能改变集合只读方式的类 
e.g.: 

Map mp=new HashMap();

mp=Collections.synchronizedMap(mp); //生成线程安全的映射表 

mp=Collections.unmodifiableMap(mp); //生成只读映射表

Comparable 自然顺序的排序类 Comparator 面向树的集合排序类

容器分类学(Container taxonomy)

集合接口: Collection List Set;Map Iterator ListIterator。

抽象类: AbstractCollection AbstractList AbstractSet AbstractMap AbstractSequentiaList。

老版本中的集合类型

Vector类

Vector,就是向量。一种异构的混合体,可以动态增加容量。对它的操作简要如下

比如我们有一个Vector: Vector myVec=new Vector(a_Array.length)

取得vector的长度:myVec.size();

赋值:set(int position,Object obj) / setElementAt(Object obj, int position) –不支持动态增长

add(Object obj )/ addElement(Object obj) 在Vector末尾加入对象

e.g.:myVec.add(new a_Array[0]);

取出元素:get(int position) / getElement(int position) 

Stack类

是Vector的子类。就是数据结构里讲滥了的堆栈(这个词可简称栈,不要混淆于heap-堆)。后进先出的存取方式。

Stack()构造空栈

Empty()叛空

Search()检查堆栈是否有元素

Peek()取得栈顶元素

Pop()弹栈

Push()入栈

Enumeration接口

Dictionary类

字典。关键字/数值方式存取数据,如果映射没有此关键字,取回null。

Hashtable类

是Dictionary结构的具体实现。

 

 

(3)集合框架的详解

Java平台提供了一个全新的集合框架。“集合框架”主要由一组用来操作对象的接口组成。不同接口描述一组不同数据类型。 


java 2集合框架图 

  集合接口:6个接口(短虚线表示),表示不同集合类型,是集合框架的基础。 

  抽象类:5个抽象类(长虚线表示),对集合接口的部分实现。可扩展为自定义集合类。 

  实现类:8个实现类(实线表示),对接口的具体实现。 

  在很大程度上,一旦您理解了接口,您就理解了框架。虽然您总要创建接口特定的实现,但访问实际集合的方法应该限制在接口方法的使用上;因此,允许您更改基本的数据结构而不必改变其它代码。 

  · Collection 接口是一组允许重复的对象。 

  · Set 接口继承 Collection,但不允许重复,使用自己内部的一个排列机制。 

  · List 接口继承 Collection,允许重复,以元素安插的次序来放置元素,不会重新排列。 

  · Map接口是一组成对的键-值对象,即所持有的是key-value pairs。Map中不能有重复的key。拥有自己的内部排列机制。 

  · 容器中的元素类型都为Object。从容器取得元素时,必须把它转换成原来的类型。 


  Java 2简化集合框架图 


集合接口 

  1.Collection 接口 

  用于表示任何对象或元素组。想要尽可能以常规方式处理一组元素时,就使用这一接口。 



  (1) 单元素添加、删除操作: 

   boolean add(Object o):将对象添加给集合 

   boolean remove(Object o): 如果集合中有与o相匹配的对象,则删除对象o 

  (2) 查询操作: 

   int size() :返回当前集合中元素的数量 

   boolean isEmpty() :判断集合中是否有任何元素 

   boolean contains(Object o) :查找集合中是否含有对象o 

   Iterator iterator() :返回一个迭代器,用来访问集合中的各个元素 

  (3) 组操作 :作用于元素组或整个集合 

   boolean containsAll(Collection c): 查找集合中是否含有集合c 中所有元素 

   boolean addAll(Collection c) : 将集合c 中所有元素添加给该集合 

   void clear(): 删除集合中所有元素 

   void removeAll(Collection c) : 从集合中删除集合c 中的所有元素 

   void retainAll(Collection c) : 从集合中删除集合c 中不包含的元素 

  (4) Collection转换为Object数组 : 

   Object[] toArray() :返回一个内含集合所有元素的array 

   Object[] toArray(Object[] a) :返回一个内含集合所有元素的array。运行期返回的array和参数a的型别相同,需要转换为正确型别。 

  此外,您还可以把集合转换成其它任何其它的对象数组。但是,您不能直接把集合转换成基本数据类型的数组,因为集合必须持有对象。 

  “斜体接口方法是可选的。因为一个接口实现必须实现所有接口方法,调用程序就需要一种途径来知道一个可选的方法是不是不受支持。如果调用一种可选方法时,一个 UnsupportedOperationException 被抛出,则操作失败,因为方法不受支持。此异常类继承 RuntimeException 类,避免了将所有集合操作放入 try-catch 块。” 

  Collection不提供get()方法。如果要遍历Collectin中的元素,就必须用Iterator。 

  1.1.AbstractCollection 抽象类 

  AbstractCollection 类提供具体“集合框架”类的基本功能。虽然您可以自行实现 Collection 接口的所有方法,但是,除了iterator()和size()方法在恰当的子类中实现以外,其它所有方法都由 AbstractCollection 类来提供实现。如果子类不覆盖某些方法,可选的如add()之类的方法将抛出异常。 

  1.2.Iterator 接口 

  Collection 接口的iterator()方法返回一个 Iterator。Iterator接口方法能以迭代方式逐个访问集合中各个元素,并安全的从Collection 中除去适当的元素。 



  (1) boolean hasNext(): 判断是否存在另一个可访问的元素 

    Object next(): 返回要访问的下一个元素。如果到达集合结尾,则抛出NoSuchElementException异常。 

  (2) void remove(): 删除上次访问返回的对象。本方法必须紧跟在一个元素的访问后执行。如果上次访问后集合已被修改,方法将抛出IllegalStateException。 

  “Iterator中删除操作对底层Collection也有影响。” 

  迭代器是 故障快速修复(fail-fast)的。这意味着,当另一个线程修改底层集合的时候,如果您正在用 Iterator 遍历集合,那么,Iterator就会抛出 ConcurrentModificationException (另一种 RuntimeException异常)异常并立刻失败。 

 2.List接口 

  List 接口继承了 Collection 接口以定义一个允许重复项的有序集合。该接口不但能够对列表的一部分进行处理,还添加了面向位置的操作。 



  (1) 面向位置的操作包括插入某个元素或 Collection 的功能,还包括获取、除去或更改元素的功能。在 List 中搜索元素可以从列表的头部或尾部开始,如果找到元素,还将报告元素所在的位置 : 

  void add(int index, Object element): 在指定位置index上添加元素element 

  boolean addAll(int index, Collection c): 将集合c的所有元素添加到指定位置index 

  Object get(int index): 返回List中指定位置的元素 

  int indexOf(Object o): 返回第一个出现元素o的位置,否则返回-1 

  int lastIndexOf(Object o) :返回最后一个出现元素o的位置,否则返回-1 

  Object remove(int index) :删除指定位置上的元素 

  Object set(int index, Object element) :用元素element取代位置index上的元素,并且返回旧的元素 

  (2) List 接口不但以位置序列迭代的遍历整个列表,还能处理集合的子集: 

   ListIterator listIterator() : 返回一个列表迭代器,用来访问列表中的元素 

   ListIterator listIterator(int index) : 返回一个列表迭代器,用来从指定位置index开始访问列表中的元素 

  List subList(int fromIndex, int toIndex) :返回从指定位置fromIndex(包含)到toIndex(不包含)范围中各个元素的列表视图 

  “对子列表的更改(如 add()、remove() 和 set() 调用)对底层 List 也有影响。” 

  2.1.ListIterator接口 

  ListIterator 接口继承 Iterator 接口以支持添加或更改底层集合中的元素,还支持双向访问。ListIterator没有当前位置,光标位于调用previous和next方法返回的值之间。一个长度为n的列表,有n+1个有效索引值: 





  (1) void add(Object o): 将对象o添加到当前位置的前面 

   void set(Object o): 用对象o替代next或previous方法访问的上一个元素。如果上次调用后列表结构被修改了,那么将抛出IllegalStateException异常。 

  (2) boolean hasPrevious(): 判断向后迭代时是否有元素可访问 

   Object previous():返回上一个对象 

   int nextIndex(): 返回下次调用next方法时将返回的元素的索引 

   int previousIndex(): 返回下次调用previous方法时将返回的元素的索引 

  “正常情况下,不用ListIterator改变某次遍历集合元素的方向 — 向前或者向后。虽然在技术上可以实现,但previous() 后立刻调用next(),返回的是同一个元素。把调用 next()和previous()的顺序颠倒一下,结果相同。” 

  “我们还需要稍微再解释一下 add() 操作。添加一个元素会导致新元素立刻被添加到隐式光标的前面。因此,添加元素后调用 previous() 会返回新元素,而调用 next() 则不起作用,返回添加操作之前的下一个元素。” 

  2.2.AbstractList和AbstractSequentialList抽象类 

  有两个抽象的 List 实现类:AbstractList 和 AbstractSequentialList。像 AbstractSet 类一样,它们覆盖了 equals() 和 hashCode() 方法以确保两个相等的集合返回相同的哈希码。若两个列表大小相等且包含顺序相同的相同元素,则这两个列表相等。这里的 hashCode() 实现在 List 接口定义中指定,而在这里实现。 

  除了equals()和hashCode(),AbstractList和AbstractSequentialList实现了其余 List 方法的一部分。因为数据的随机访问和顺序访问是分别实现的,使得具体列表实现的创建更为容易。需要定义的一套方法取决于您希望支持的行为。您永远不必亲自提供的是 iterator方法的实现。 

  2.3. LinkedList类和ArrayList类 

  在“集合框架”中有两种常规的 List 实现:ArrayList 和 LinkedList。使用两种 List 实现的哪一种取决于您特定的需要。如果要支持随机访问,而不必在除尾部的任何位置插入或除去元素,那么,ArrayList 提供了可选的集合。但如果,您要频繁的从列表的中间位置添加和除去元素,而只要顺序的访问列表元素,那么,LinkedList 实现更好。 

  “ArrayList 和 LinkedList 都实现 Cloneable 接口,都提供了两个构造函数,一个无参的,一个接受另一个Collection”

  2.3.1. LinkedList类 

  LinkedList类添加了一些处理列表两端元素的方法。 



  (1) void addFirst(Object o): 将对象o添加到列表的开头 

    void addLast(Object o):将对象o添加到列表的结尾 

  (2) Object getFirst(): 返回列表开头的元素 

    Object getLast(): 返回列表结尾的元素 

  (3) Object removeFirst(): 删除并且返回列表开头的元素 

    Object removeLast():删除并且返回列表结尾的元素 

  (4) LinkedList(): 构建一个空的链接列表 

    LinkedList(Collection c): 构建一个链接列表,并且添加集合c的所有元素 

  “使用这些新方法,您就可以轻松的把 LinkedList 当作一个堆栈、队列或其它面向端点的数据结构。” 

  2.3.2. ArrayList类 

  ArrayList类封装了一个动态再分配的Object[]数组。每个ArrayList对象有一个capacity。这个capacity表示存储列表中元素的数组的容量。当元素添加到ArrayList时,它的capacity在常量时间内自动增加。 

  在向一个ArrayList对象添加大量元素的程序中,可使用ensureCapacity方法增加capacity。这可以减少增加重分配的数量。 

  (1) void ensureCapacity(int minCapacity): 将ArrayList对象容量增加minCapacity 

  (2) void trimToSize(): 整理ArrayList对象容量为列表当前大小。程序可使用这个操作减少ArrayList对象存储空间。 

  2.3.2.1. RandomAccess接口 

  一个特征接口。该接口没有任何方法,不过你可以使用该接口来测试某个集合是否支持有效的随机访问。ArrayList和Vector类用于实现该接口。 

3.Set接口 

  Set 接口继承 Collection 接口,而且它不允许集合中存在重复项,每个具体的 Set 实现类依赖添加的对象的 equals()方法来检查独一性。Set接口没有引入新方法,所以Set就是一个Collection,只不过其行为不同。 



  3.1. Hash表 

  Hash表是一种数据结构,用来查找对象。Hash表为每个对象计算出一个整数,称为Hash Code(哈希码)。Hash表是个链接式列表的阵列。每个列表称为一个buckets(哈希表元)。对象位置的计算 index = HashCode % buckets (HashCode为对象哈希码,buckets为哈希表元总数)。 

  当你添加元素时,有时你会遇到已经填充了元素的哈希表元,这种情况称为Hash Collisions(哈希冲突)。这时,你必须判断该元素是否已经存在于该哈希表中。 

  如果哈希码是合理地随机分布的,并且哈希表元的数量足够大,那么哈希冲突的数量就会减少。同时,你也可以通过设定一个初始的哈希表元数量来更好地控制哈希表的运行。初始哈希表元的数量为 buckets = size * 150% + 1 (size为预期元素的数量)。 

  如果哈希表中的元素放得太满,就必须进行rehashing(再哈希)。再哈希使哈希表元数增倍,并将原有的对象重新导入新的哈希表元中,而原始的哈希表元被删除。load factor(加载因子)决定何时要对哈希表进行再哈希。在Java编程语言中,加载因子默认值为0.75,默认哈希表元为101。 

  3.2. Comparable接口和Comparator接口 

  在“集合框架”中有两种比较接口:Comparable接口和Comparator接口。像String和Integer等Java内建类实现Comparable接口以提供一定排序方式,但这样只能实现该接口一次。对于那些没有实现Comparable接口的类、或者自定义的类,您可以通过Comparator接口来定义您自己的比较方式。 

  3.2.1. Comparable接口 

  在java.lang包中,Comparable接口适用于一个类有自然顺序的时候。假定对象集合是同一类型,该接口允许您把集合排序成自然顺序。 



  (1) int compareTo(Object o): 比较当前实例对象与对象o,如果位于对象o之前,返回负值,如果两个对象在排序中位置相同,则返回0,如果位于对象o后面,则返回正值 

  在 Java 2 SDK版本1.4中有二十四个类实现Comparable接口。下表展示了8种基本类型的自然排序。虽然一些类共享同一种自然排序,但只有相互可比的类才能排序。 



类 排序 
BigDecimal,BigInteger,Byte, Double, Float,Integer,Long,Short 按数字大小排序 
Character 按 Unicode 值的数字大小排序 
String 按字符串中字符 Unicode 值排序 

排序
BigDecimal,BigInteger,Byte, Double, Float,Integer,Long,Short按数字大小排序
Character按 Unicode 值的数字大小排序
String按字符串中字符 Unicode 值排序
   
  利用Comparable接口创建您自己的类的排序顺序,只是实现compareTo()方法的问题。通常就是依赖几个数据成员的自然排序。同时类也应该覆盖equals()和hashCode()以确保两个相等的对象返回同一个哈希码。 

  3.2.2. Comparator接口 

  若一个类不能用于实现java.lang.Comparable,或者您不喜欢缺省的Comparable行为并想提供自己的排序顺序(可能多种排序方式),你可以实现Comparator接口,从而定义一个比较器。 




  (1)int compare(Object o1, Object o2): 对两个对象o1和o2进行比较,如果o1位于o2的前面,则返回负值,如果在排序顺序中认为o1和o2是相同的,返回0,如果o1位于o2的后面,则返回正值 

  “与Comparable相似,0返回值不表示元素相等。一个0返回值只是表示两个对象排在同一位置。由Comparator用户决定如何处理。如果两个不相等的元素比较的结果为零,您首先应该确信那就是您要的结果,然后记录行为。” 

  (2)boolean equals(Object obj): 指示对象obj是否和比较器相等。 

  “该方法覆写Object的equals()方法,检查的是Comparator实现的等同性,不是处于比较状态下的对象。” 


3.3. SortedSet接口 

  “集合框架”提供了个特殊的Set接口:SortedSet,它保持元素的有序顺序。SortedSet接口为集的视图(子集)和它的两端(即头和尾)提供了访问方法。当您处理列表的子集时,更改视图会反映到源集。此外,更改源集也会反映在子集上。发生这种情况的原因在于视图由两端的元素而不是下标元素指定,所以如果您想要一个特殊的高端元素(toElement)在子集中,您必须找到下一个元素。 

  添加到SortedSet实现类的元素必须实现Comparable接口,否则您必须给它的构造函数提供一个Comparator接口的实现。TreeSet类是它的唯一一份实现。 

  “因为集必须包含唯一的项,如果添加元素时比较两个元素导致了0返回值(通过Comparable的compareTo()方法或Comparator的compare()方法),那么新元素就没有添加进去。如果两个元素相等,那还好。但如果它们不相等的话,您接下来就应该修改比较方法,让比较方法和 equals() 的效果一致。” 



  (1) Comparator comparator(): 返回对元素进行排序时使用的比较器,如果使用Comparable接口的compareTo()方法对元素进行比较,则返回null 

  (2) Object first(): 返回有序集合中第一个(最低)元素 

  (3) Object last(): 返回有序集合中最后一个(最高)元素 

  (4) SortedSet subSet(Object fromElement, Object toElement): 返回从fromElement(包括)至toElement(不包括)范围内元素的SortedSet视图(子集) 

  (5) SortedSet headSet(Object toElement): 返回SortedSet的一个视图,其内各元素皆小于toElement 

  (6) SortedSet tailSet(Object fromElement): 返回SortedSet的一个视图,其内各元素皆大于或等于fromElement 

  3.4. AbstractSet抽象类 

  AbstractSet类覆盖了Object类的equals()和hashCode()方法,以确保两个相等的集返回相同的哈希码。若两个集大小相等且包含相同元素,则这两个集相等。按定义,集的哈希码是集中元素哈希码的总和。因此,不论集的内部顺序如何,两个相等的集会有相同的哈希码。 

  3.4.1. Object类 

  (1) boolean equals(Object obj): 对两个对象进行比较,以便确定它们是否相同 

  (2) int hashCode(): 返回该对象的哈希码。相同的对象必须返回相同的哈希码 

  3.5. HashSet类类和TreeSet类 

  “集合框架”支持Set接口两种普通的实现:HashSet和TreeSet(TreeSet实现SortedSet接口)。在更多情况下,您会使用 HashSet 存储重复自由的集合。考虑到效率,添加到 HashSet 的对象需要采用恰当分配哈希码的方式来实现hashCode()方法。虽然大多数系统类覆盖了 Object中缺省的hashCode()和equals()实现,但创建您自己的要添加到HashSet的类时,别忘了覆盖 hashCode()和equals()。 

  当您要从集合中以有序的方式插入和抽取元素时,TreeSet实现会有用处。为了能顺利进行,添加到TreeSet的元素必须是可排序的。 

  3.5.1.HashSet类 

  (1) HashSet(): 构建一个空的哈希集 

  (2) HashSet(Collection c): 构建一个哈希集,并且添加集合c中所有元素 

  (3) HashSet(int initialCapacity): 构建一个拥有特定容量的空哈希集 

  (4) HashSet(int initialCapacity, float loadFactor): 构建一个拥有特定容量和加载因子的空哈希集。LoadFactor是0.0至1.0之间的一个数 

  3.5.2. TreeSet类 

  (1) TreeSet():构建一个空的树集 

  (2) TreeSet(Collection c): 构建一个树集,并且添加集合c中所有元素 

  (3) TreeSet(Comparator c): 构建一个树集,并且使用特定的比较器对其元素进行排序 

  “comparator比较器没有任何数据,它只是比较方法的存放器。这种对象有时称为函数对象。函数对象通常在“运行过程中”被定义为匿名内部类的一个实例。” 

  TreeSet(SortedSet s): 构建一个树集,添加有序集合s中所有元素,并且使用与有序集合s相同的比较器排序 

  3.6. LinkedHashSet类 

  LinkedHashSet扩展HashSet。如果想跟踪添加给HashSet的元素的顺序,LinkedHashSet实现会有帮助。LinkedHashSet的迭代器按照元素的插入顺序来访问各个元素。它提供了一个可以快速访问各个元素的有序集合。同时,它也增加了实现的代价,因为哈希表元中的各个元素是通过双重链接式列表链接在一起的。 

  (1) LinkedHashSet(): 构建一个空的链接式哈希集 

  (2) LinkedHashSet(Collection c): 构建一个链接式哈希集,并且添加集合c中所有元素 

  (3) LinkedHashSet(int initialCapacity): 构建一个拥有特定容量的空链接式哈希集 

  (4) LinkedHashSet(int initialCapacity, float loadFactor): 构建一个拥有特定容量和加载因子的空链接式哈希集。LoadFactor是0.0至1.0之间的一个数 

  “为优化HashSet空间的使用,您可以调优初始容量和负载因子。TreeSet不包含调优选项,因为树总是平衡的。” 

4. Map接口 

  Map接口不是Collection接口的继承。Map接口用于维护键/值对(key/value pairs)。该接口描述了从不重复的键到值的映射。 



  (1) 添加、删除操作: 

  Object put(Object key, Object value): 将互相关联的一个关键字与一个值放入该映像。如果该关键字已经存在,那么与此关键字相关的新值将取代旧值。方法返回关键字的旧值,如果关键字原先并不存在,则返回null 

  Object remove(Object key): 从映像中删除与key相关的映射 

  void putAll(Map t): 将来自特定映像的所有元素添加给该映像 

  void clear(): 从映像中删除所有映射 

  “键和值都可以为null。但是,您不能把Map作为一个键或值添加给自身。” 

  (2) 查询操作: 

  Object get(Object key): 获得与关键字key相关的值,并且返回与关键字key相关的对象,如果没有在该映像中找到该关键字,则返回null 

  boolean containsKey(Object key): 判断映像中是否存在关键字key 

  boolean containsValue(Object value): 判断映像中是否存在值value 

  int size(): 返回当前映像中映射的数量 

  boolean isEmpty() :判断映像中是否有任何映射 

  (3) 视图操作 :处理映像中键/值对组 

  Set keySet(): 返回映像中所有关键字的视图集 

  “因为映射中键的集合必须是唯一的,您用Set支持。你还可以从视图中删除元素,同时,关键字和它相关的值将从源映像中被删除,但是你不能添加任何元素。” 

  Collection values():返回映像中所有值的视图集 

  “因为映射中值的集合不是唯一的,您用Collection支持。你还可以从视图中删除元素,同时,值和它的关键字将从源映像中被删除,但是你不能添加任何元素。” 

  Set entrySet(): 返回Map.Entry对象的视图集,即映像中的关键字/值对 

  “因为映射是唯一的,您用Set支持。你还可以从视图中删除元素,同时,这些元素将从源映像中被删除,但是你不能添加任何元素。” 

  4.1. Map.Entry接口 

  Map的entrySet()方法返回一个实现Map.Entry接口的对象集合。集合中每个对象都是底层Map中一个特定的键/值对。 



  通过这个集合的迭代器,您可以获得每一个条目(唯一获取方式)的键或值并对值进行更改。当条目通过迭代器返回后,除非是迭代器自身的remove()方法或者迭代器返回的条目的setValue()方法,其余对源Map外部的修改都会导致此条目集变得无效,同时产生条目行为未定义。 

  (1) Object getKey(): 返回条目的关键字 

  (2) Object getValue(): 返回条目的值 

  (3) Object setValue(Object value): 将相关映像中的值改为value,并且返回旧值 

  4.2. SortedMap接口 

  “集合框架”提供了个特殊的Map接口:SortedMap,它用来保持键的有序顺序。 



  SortedMap接口为映像的视图(子集),包括两个端点提供了访问方法。除了排序是作用于映射的键以外,处理SortedMap和处理SortedSet一样。 

  添加到SortedMap实现类的元素必须实现Comparable接口,否则您必须给它的构造函数提供一个Comparator接口的实现。TreeMap类是它的唯一一份实现。 

  “因为对于映射来说,每个键只能对应一个值,如果在添加一个键/值对时比较两个键产生了0返回值(通过Comparable的compareTo()方法或通过Comparator的compare()方法),那么,原始键对应值被新的值替代。如果两个元素相等,那还好。但如果不相等,那么您就应该修改比较方法,让比较方法和 equals() 的效果一致。” 

  (1) Comparator comparator(): 返回对关键字进行排序时使用的比较器,如果使用Comparable接口的compareTo()方法对关键字进行比较,则返回null 

  (2) Object firstKey(): 返回映像中第一个(最低)关键字 

  (3) Object lastKey(): 返回映像中最后一个(最高)关键字 

  (4) SortedMap subMap(Object fromKey, Object toKey): 返回从fromKey(包括)至toKey(不包括)范围内元素的SortedMap视图(子集) 

  (5) SortedMap headMap(Object toKey): 返回SortedMap的一个视图,其内各元素的key皆小于toKey 

  (6) SortedSet tailMap(Object fromKey): 返回SortedMap的一个视图,其内各元素的key皆大于或等于fromKey 

  4.3. AbstractMap抽象类 

  和其它抽象集合实现相似,AbstractMap 类覆盖了equals()和hashCode()方法以确保两个相等映射返回相同的哈希码。如果两个映射大小相等、包含同样的键且每个键在这两个映射中对应的值都相同,则这两个映射相等。映射的哈希码是映射元素哈希码的总和,其中每个元素是Map.Entry接口的一个实现。因此,不论映射内部顺序如何,两个相等映射会报告相同的哈希码。 

  4.4. HashMap类和TreeMap类 

  “集合框架”提供两种常规的Map实现:HashMap和TreeMap (TreeMap实现SortedMap接口)。在Map 中插入、删除和定位元素,HashMap 是最好的选择。但如果您要按自然顺序或自定义顺序遍历键,那么TreeMap会更好。使用HashMap要求添加的键类明确定义了hashCode()和equals()的实现。 

  这个TreeMap没有调优选项,因为该树总处于平衡状态。 

  4.4.1. HashMap类 

  为了优化HashMap空间的使用,您可以调优初始容量和负载因子。 

  (1) HashMap(): 构建一个空的哈希映像 

  (2) HashMap(Map m): 构建一个哈希映像,并且添加映像m的所有映射 

  (3) HashMap(int initialCapacity): 构建一个拥有特定容量的空的哈希映像 

  (4) HashMap(int initialCapacity, float loadFactor): 构建一个拥有特定容量和加载因子的空的哈希映像 

  4.4.2. TreeMap类 

  TreeMap没有调优选项,因为该树总处于平衡状态。 

  (1) TreeMap():构建一个空的映像树 

  (2) TreeMap(Map m): 构建一个映像树,并且添加映像m中所有元素 

  (3) TreeMap(Comparator c): 构建一个映像树,并且使用特定的比较器对关键字进行排序 

  (4) TreeMap(SortedMap s): 构建一个映像树,添加映像树s中所有映射,并且使用与有序映像s相同的比较器排序 

  4.5. LinkedHashMap类 

  LinkedHashMap扩展HashMap,以插入顺序将关键字/值对添加进链接哈希映像中。象LinkedHashSet一样,LinkedHashMap内部也采用双重链接式列表。 

  (1) LinkedHashMap(): 构建一个空链接哈希映像 

  (2) LinkedHashMap(Map m): 构建一个链接哈希映像,并且添加映像m中所有映射 

  (3) LinkedHashMap(int initialCapacity): 构建一个拥有特定容量的空的链接哈希映像 

  (4) LinkedHashMap(int initialCapacity, float loadFactor): 构建一个拥有特定容量和加载因子的空的链接哈希映像 

  (5) LinkedHashMap(int initialCapacity, float loadFactor, 

  boolean accessOrder): 构建一个拥有特定容量、加载因子和访问顺序排序的空的链接哈希映像 

  “如果将accessOrder设置为true,那么链接哈希映像将使用访问顺序而不是插入顺序来迭 

  代各个映像。每次调用get或者put方法时,相关的映射便从它的当前位置上删除,然后放到链接式映像列表的结尾处(只有链接式映像列表中的位置才会受到影响,哈希表元则不受影响。哈希表映射总是待在对应于关键字的哈希码的哈希表元中)。” 

  “该特性对于实现高速缓存的“删除最近最少使用”的原则很有用。例如,你可以希望将最常访问的映射保存在内存中,并且从数据库中读取不经常访问的对象。当你在表中找不到某个映射,并且该表中的映射已经放得非常满时,你可以让迭代器进入该表,将它枚举的开头几个映射删除掉。这些是最近最少使用的映射。” 

  (6) protected boolean removeEldestEntry(Map.Entry eldest): 如果你想删除最老的映射,则覆盖该方法,以便返回true。当某个映射已经添加给映像之后,便调用该方法。它的默认实现方法返回false,表示默认条件下老的映射没有被删除。但是你可以重新定义本方法,以便有选择地在最老的映射符合某个条件,或者映像超过了某个大小时,返回true。 

  4.6. WeakHashMap类 

  WeakHashMap是Map的一个特殊实现,它使用WeakReference(弱引用)来存放哈希表关键字。使用这种方式时,当映射的键在 WeakHashMap 的外部不再被引用时,垃圾收集器会将它回收,但它将把到达该对象的弱引用纳入一个队列。WeakHashMap的运行将定期检查该队列,以便找出新到达的弱应用。当一个弱引用到达该队列时,就表示关键字不再被任何人使用,并且它已经被收集起来。然后WeakHashMap便删除相关的映射。 

  (1) WeakHashMap(): 构建一个空弱哈希映像 

  (2) WeakHashMap(Map t): 构建一个弱哈希映像,并且添加映像t中所有映射 

  (3) WeakHashMap(int initialCapacity): 构建一个拥有特定容量的空的弱哈希映像 

  (4) WeakHashMap(int initialCapacity, float loadFactor): 构建一个拥有特定容量和加载因子的空的弱哈希映像 

  4.6. IdentityHashMap类 

  IdentityHashMap也是Map的一个特殊实现。在这个类中,关键字的哈希码不应该由hashCode()方法来计算,而应该由System.identityHashCode方法进行计算(即使已经重新定义了hashCode方法)。这是Object.hashCode根据对象的内存地址来计算哈希码时使用的方法。另外,为了对各个对象进行比较,IdentityHashMap将使用==,而不使用equals方法。 

  换句话说,不同的关键字对象,即使它们的内容相同,也被视为不同的对象。IdentityHashMap类可以用于实现对象拓扑结构转换(topology-preserving object graph transformations)(比如实现对象的串行化或深度拷贝),在进行转换时,需要一个“节点表”跟踪那些已经处理过的对象的引用。即使碰巧有对象相等,“节点表”也不应视其相等。另一个应用是维护代理对象。比如,调试工具希望在程序调试期间维护每个对象的一个代理对象。 

  “IdentityHashMap类不是一般意义的Map实现!它的实现有意的违背了Map接口要求通过equals方法比较对象的约定。这个类仅使用在很少发生的需要强调等同性语义的情况。” 

  (1) IdentityHashMap (): 构建一个空的全同哈希映像,默认预期最大尺寸为21 

  “预期最大尺寸是映像期望把持的键/值映射的最大数目” 

  (2) IdentityHashMap (Map m): 构建一个全同哈希映像,并且添加映像m中所有映射 

  (3) IdentityHashMap (int expectedMaxSize): 构建一个拥有预期最大尺寸的空的全同哈希映像。放置超过预期最大尺寸的键/值映射时,将引起内部数据结构的增长,有时可能很费时
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值