Java-Collection Framework学习要点

最新推荐文章于 2024-04-17 10:59:38 发布

zolalad

最新推荐文章于 2024-04-17 10:59:38 发布

阅读量7.6k

点赞数 11

分类专栏： Java技术文章标签： List map set java

本文链接：https://blog.csdn.net/zolalad/article/details/11368561

版权

Java技术专栏收录该内容

49 篇文章 3 订阅

订阅专栏

JAVA的集合框架（Java Collection Framework）是JAVA的基础知识，在我们的开发过程中几乎是时时刻刻都要用到的东西。但是因为其中的接口和类很多，我们未必会对其完全熟悉。集合即存储对象的容器，面向对象语言对事物的体现都是以对象的形式，所以为了方便对多个对象的操作，存储对象，集合是存储对象最常用的一种方式。集合的出现就是为了持有对象。集合中可以存储任意类型的对象, 而且长度可变。在程序中有可能无法预先知道需要多少个对象, 那么用数组来装对象的话, 长度不好定义, 而集合解决了这样的问题。

前言

为什么会出现集合类：面向对象语言对事物的体现是以对象的形式，所以为了方便对多个对象的操作，就对对象进行存储，集合就是存储对象最常用的一种方式。

为什么会有这么多的容器（即集合类）呢？ 因为每一个容器对数据的存储方式都有不同，这存储方式成为数据的存储结构。

数组和集合类同时容器的区别：数组虽然也可以存储对象，但数组的长度是固定的。而集合类容器的长度是可变的。

1.Collection集合类层次结构-下面的图展示了集合类的层次结构：

2.Map集合--这里需要注意Map不属于Collection集合，Map本身是另一个根节点的集合

3. 下面来做个详细的类图

或：

从上我们可以看出，最顶端其实就是4个接口：Collection ，List ，Set ，和Map ，其中List和Set是继承自Collection，而Map则自成一脉。这些接口都是在java.util路径下的，都属于java的基础类库rt.jar。

这里我们需要专门说明一下：java.util.Collections，是不属于java的集合框架的，它是一个集合的工具类，它包含专门操作集合的静态方法，如排序、拷贝、匹配查找等等，比如我们常用它的排序方法：Collections.sort(List), Collections.sort(List, Comparator)。

4. 那么该如何遍历Collection中的每一个元素

在java语言中，不论Collection的实际类型如何，它都支持一个iterator()的方法，该方法返回一个迭代子，使用该迭代子即可逐一访问Collection中每一个元素。因为Iterable接口（java.lang.Iterable）是集合类父类接口中其中一个，Collection接口继承了Iterable接口，所以所有Collection的子类都实现了Iterable接口，所以实现了该接口的类都可以采用以下的这种方式进行迭代。

典型的用法如下：

　　　　Iterator it = collection.iterator();//获得一个迭代子
　　　　while(it.hasNext()) {
　　　　　　Object obj = it.next();//得到下一个元素
　　　　}

// iterator方式
Collection collection = new HashSet();
//... add elements to the collection

Iterator iterator = collection.iterator();
while(iterator.hasNext()){
    Object object = iterator.next();
    //do something to object;    
}

// for-loop方式
Collection collection = new HashSet();
//... add elements to the collection

for(Object object : collection) {
  //do something to object;
}

代码示例：（二者的效果是一样的）

import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;

public class Test123 {
	public static void main(String[] args) {
		List<Integer> list = new ArrayList<Integer>();
		list.add(6);
		list.add(4);
		list.add(3);
		list.add(2);
		list.add(1);
        //增强for循环方式遍历输出
		for (Object obj : list) {
			// do somthong with obj
			System.out.println(obj);
		}
		System.out.println("---------------------");
		//利用迭代器方法输出
		Iterator it = list.iterator();
		while(it.hasNext()){
			System.out.println(it.next());			
		}		
	}
}

一、List接口

Collection是最基本的集合接口，一个Collection代表一组Object，即Collection的元素。由Collection接口派生的两个接口是List和Set。

List是有序的Collection，使用此接口能够精确的控制每个元素插入的位置。用户能够使用索引（元素在List中的位置，类似于数组下标）来访问List中的元素，这类似于Java的数组。和下面要提到的Set不同，List允许有相同的元素。除了具有Collection接口必备的iterator()方法外，List还提供一个listIterator迭代器类。

ListIterater(列表迭代器)：List集合特有的迭代器，ListInterator是Iterator的子接口。在迭代时，不可以通过集合对象的方法操作集合中的元素，因为发生ConcurrentModifiception异常，所以在迭代时，只能用迭代器的方法操作元素，可是Iterator方法是有限的，只能对元素进行判断，取出，删除的操作,如果想要其他的操作如添加，修改等，就需要使用其子接口ListIterator,该接口只能通过List集合的listIterator方法获取listIterator常见方法：
void add(E e)：将指定元素添加到集合
boolean hasNext()：以正向遍历列表时，是否还有元素可以迭代，则返true
boolean hasPrevious()：如果以逆向遍历列表，是否还有元素可以迭代，则返回 true。
Enext()：返回列表中的下一个元素
Eprevious()：返回列表中的前一个元素
void set(E e)：修改返回的元素
void remove()：从列表中删除返回的元素。对于每个 next或 previous调用，只能执行一次此调用。只有在最后一次调用 next或 previous之后，尚未调用 ListIterator.add时才可以执行该调用。

实现List接口的常用类有ArrayList，LinkedList，Vector和Stack四种。

1. ArrayList类：

ArrayList实现了可变大小的数组（动态数组），它允许所有元素，包括null，存放是有序存放，且对象可以重复。其内部方法：size，isEmpty，get，set方法运行时间为常数，但是add方法开销为分摊的常数，添加n个元素需要O(n)的时间。

每个ArrayList实例都有一个容量（Capacity），即用于存储元素的数组的大小。这个容量可随着不断添加新元素而自动增加，但是增长算法并没有定义。当需要插入大量元素时，在插入前可以调用ensureCapacity方法来增加ArrayList的容量以提高插入效率。

和LinkedList一样，ArrayList也是非同步的（unsynchronized）。

2. LinkedList类

LinkedList实现了List接口，允许null元素，它以链表的形式存放对象，这样就克服了ArrayList的插入、删除的不便，但查询效率不如ArrayList高。

此外LinkedList提供额外的addFirst(), addLast(), getFirst(), getLast(), removeFirst() 和 removeLast()等方法在 LinkedList的首部或尾部。这些操作使LinkedList可被用作堆栈（stack），队列（queue）或双向队列（deque）。

注意LinkedList没有同步方法，如果多个线程同时访问一个List，则必须自己实现访问同步。一种解决方法是在创建List时构造一个同步的List：

List list = Collections.synchronizedList(new LinkedList(...));

3. Vector类

Vector非常类似ArrayList，但是Vector是同步的。由Vector创建的Iterator，虽然和ArrayList创建的 Iterator是同一接口，但是，因为Vector是同步的，当一个Iterator被创建而且正在被使用，另一个线程改变了Vector的状态（例如，添加或删除了一些元素），这时调用Iterator的方法时将抛出ConcurrentModificationException，因此必须捕获该异常。

4. Stack 类

Stack继承自Vector，实现一个后进先出的堆栈。Stack提供5个额外的方法使得Vector得以被当作堆栈使用。基本的push和pop方法，还有peek方法得到栈顶的元素，empty方法测试堆栈是否为空，search方法检测一个元素在堆栈中的位置。Stack刚创建后是空栈。

总结：ArrayList和Vector的区别：ArrayList是非线程安全的，效率高；Vector是基于线程安全的，效率低。

二、 Set 接口

Set：集合中对象不按特殊方式排序，并且没有重复对象。它的有些实现类能够对集合中的对象按照特定方式排序。

Set特点：元素无放入顺序，元素（即对象）不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的）。

Set接口的两个实现类：HashSet和TreeSet，LinkedHashSet。

1. HashSet类按照哈希算法来存取对象，具有很好的存取和查找性能。由于采用这种算法，所以应该覆盖Object类中的equals()方法和hashCode()方法，否则可能会使HashSet无法正常工作。

有重复对象equals()方法返回为true；

重复对象hashCode()方法返回相同的整数；

不同的对象，应使hashCode()返回的整数尽量不同，这样可减少调用equals()方法的次数，提高程序运行效率。

2. TreeSet类：底层由平衡二叉树实现，该类实现了SortedSet接口，能够对集合中的对象进行排序。在元素添加的同时，根据给出的排序规则，进行排序。

唯一性保证：根据排序规则，compareTo()方法返回为0，就可以认定两个对象中有一个是重复对象。

总结：Set是一种不包含重复的元素的Collection，即任意的两个元素e1和e2都有e1.equals(e2)=false，Set最多有一个null元素。很明显，Set的构造函数有一个约束条件，传入的Collection参数不能包含重复的元素。

三、 Map

请注意，Map没有继承Collection接口，Map提供key到value的映射。一个Map中不能包含相同的key，每个key只能映射一个 value。Map接口提供3种集合的视图，Map的内容可以被当作一组key集合，一组value集合，或者一组key-value映射。

Map接口有三个实现类：HashMap，HashTable，TreeMap，LinkedHashMap，其中比较常用的两个是：HashMap和TreeMap。

1. Hashtable类----同步，线程安全

Hashtable继承Map接口，实现一个key-value映射的哈希表。任何非空（non-null）的对象都可作为key或者value。Hashtable通过initial capacity和load factor两个参数调整性能。通常缺省的load factor 0.75较好地实现了时间和空间的均衡。增大load factor可以节省空间但相应的查找时间将增大，这会影响像get和put这样的操作。

添加数据使用put(key, value)，取出数据使用get(key)，这两个基本操作的时间开销为常数。使用Hashtable的简单示例如下，将1，2，3放到Hashtable中，他们的key分别是”one”，”two”，”three”：

 Hashtable numbers = new Hashtable();
　　　　numbers.put(“one”,new Integer(1));
　　　　numbers.put(“two”,new Integer(2));
　　　　numbers.put(“three”,new Integer(3));

要取出一个数，比如2，用相应的key：

　　　　Integer n = (Integer)numbers.get(“two”);
　　　　System.out.println(“two = ” + n);

由于作为key的对象将通过计算其散列函数来确定与之对应的value的位置，因此任何作为key的对象都必须实现hashCode和equals方法（因为只有获取到key的hashCode，才能根据其hashCode代入散列函数以求得value的存储位置）。注：hashCode是jdk根据对象的地址或者字符串或者数字算出来的int类型的数值。

hashCode和equals方法继承自根类Object，如果你用自定义的类当作key的话，要相当小心，按照散列函数的定义，如果两个对象相同，即obj1.equals(obj2)=true，则它们的hashCode必须相同，但如果两个对象不同，则它们的hashCode不一定不同，如果两个不同对象的hashCode相同，这种现象称为冲突，冲突会导致操作哈希表的时间开销增大，所以尽量定义好的hashCode()方法，能加快哈希表的操作。如果相同的对象有不同的hashCode，对哈希表的操作会出现意想不到的结果（期待的get方法返回null），要避免这种问题，只需要牢记一条：要同时复写equals方法和hashCode方法，而不要只写其中一个。

2. HashMap类----非同步，非线程安全

HashMap和Hashtable类似，不同之处在于HashMap是非同步的，并且允许null，即null value和null key。但是将HashMap视为Collection时（values()方法可返回Collection），其迭代子操作时间开销和HashMap 的容量成比例。因此，如果迭代操作的性能相当重要的话，不要将HashMap的初始化容量设得过高，或者load factor过低。

3. TreeMap类：TreeMap实现了SortedMap接口，能对键对象进行排序。添加元素时根据给出的排序规则进行排序。

4. WeakHashMap类：WeakHashMap是一种改进的HashMap，它对key实行“弱引用”，如果一个key不再被外部所引用，那么该key可以被GC回收。

小结：Java为数据结构中的映射定义了一个接口java.util.Map;它有四个实现类,分别是HashMap Hashtable LinkedHashMap 和TreeMap.

Map主要用于存储健值对，根据键得到值，因此不允许键重复(重复了覆盖了),但允许值重复。
Hashmap 是一个最常用的Map,它根据键的HashCode值存储数据,根据键可以直接获取它的值，具有很快的访问速度，遍历时，取得数据的顺序是完全随机的。 HashMap最多只允许一条记录的键为Null;允许多条记录的值为 Null;HashMap不支持线程的同步，即任一时刻可以有多个线程同时写HashMap;可能会导致数据的不一致。如果需要同步，可以用 Collections的synchronizedMap方法使HashMap具有同步的能力，或者使用ConcurrentHashMap。
Hashtable与 HashMap类似,它继承自Dictionary类，不同的是:它不允许记录的键或者值为空;它支持线程的同步，即任一时刻只有一个线程能写Hashtable,因此也导致了 Hashtable在写入时会比较慢。
LinkedHashMap 是HashMap的一个子类，保存了记录的插入顺序，在用Iterator遍历LinkedHashMap时，先得到的记录肯定是先插入的.也可以在构造时用带参数，按照应用次数排序。在遍历的时候会比HashMap慢，不过有种情况例外，当HashMap容量很大，实际数据较少时，遍历起来可能会比 LinkedHashMap慢，因为LinkedHashMap的遍历速度只和实际数据有关，和容量无关，而HashMap的遍历速度和他的容量有关。
TreeMap实现SortMap接口，能够把它保存的记录根据键排序,默认是按键值的升序排序，也可以指定排序的比较器，当用Iterator 遍历TreeMap时，得到的记录是排过序的。
一般情况下，我们用的最多的是HashMap,在Map 中插入、删除和定位元素，HashMap 是最好的选择。但如果您要按自然顺序或自定义顺序遍历键，那么TreeMap会更好。如果需要输出的顺序和输入的相同,那么用LinkedHashMap 可以实现,它还可以按读取顺序来排列.

总结：

如果涉及到堆栈，队列等操作，应该考虑用List，

对于需要快速插入，删除元素，应该使用LinkedList，

如果需要快速随机访问元素，应该使用ArrayList，

如果程序在单线程环境中，或者访问仅仅在一个线程中进行，考虑非同步的类，其效率较高，如果多个线程可能同时操作一个类，应该使用同步的类。

要特别注意对哈希表的操作，作为key的对象要正确复写equals和hashCode方法。

尽量返回接口而非实际的类型，如返回List而非ArrayList，这样如果以后需要将ArrayList换成LinkedList时，客户端代码不用改变，这就是针对抽象编程。

参考：http://blog.csdn.net/abbuggy/article/details/7720666

zolalad

关注

11
点赞
踩
34

收藏

觉得还不错? 一键收藏
2
评论
Java-Collection Framework学习要点

JAVA的集合框架（Java Collection Framework）是JAVA的基础知识，在我们的开发过程中几乎是时时刻刻都要用到的东西。但是因为其中的接口和类很多，我们未必会对其完全熟悉。这里，我就做个简单的归纳和介绍。从上我们可以看出，最顶端其实就是4个接口：Collection ，List ，Set ，和Map 。其中List和Set是继承自Collecti
复制链接

扫一扫