Java 集合

image

上图是java 集合框架的接口继承图,集合中有两个基本接口:Collection 和 Map。Collection 实现了 Iterable 接口,所以所有实现了 Iterable 接口的类都能使用 Iterator 迭代器。

image

image

上图是Java 集合框架的类的继承图

实体集合/映射接口重复项有序/排序元素调用方法实现类数据结构值是否可为NULL是否为同步
ArrayListList可以重复插入排序equals()可调大小数组YESNO
LinkedListList可以重复插入排序equals()链表YESNO
VectorList可以重复插入排序equals()可调大小数组YES
HashSetSet元素唯一无顺序equals()、hashCode()Hash表
LinkedHashSetSet元素唯一插入排序equals()、hashCode()Hash表和双向链表
TreeSetSortedSet元素唯一排序equals()、compareTo()红黑树
HashMapMap键唯一无顺序equals()、hashCode()Hash表
LinkedHashMapMap键唯一键插入顺序/条目访问顺序equals()、hashCode()Hash表和双向链表
HashtableMap键唯一无顺序equals()、hashCode()Hash表NOYES
TreeMapSortedMap键唯一键序排列equals()、compareTo()红黑树

对JAVA的集合的理解是相对于数组:
  数组是大小固定的,并且同一个数组只能存放类型一样的数据(基本类型/引用类型),JAVA集合可以存储和操作数目不固定的一组数据。 所有的JAVA集合都位于 java.util包中!
  只有实现了 Iterable 接口的类才能使用 iterator() 方法返回一个 Iterator , Collection 继承了Iterable接口,所以List,Set,Queue等都实现了Iterable接口并且覆写了接口中的iterator()方法,所以才能使用迭代器输出。另外对于foreach语句,只有实现了Iterable接口的类才可以使用。
JDK源码Iterable接口:

public interface Iterable<T> {
    Iterator<T> iterator();
}

JDK源码Iterator接口:

public interface Iterator<T> {
    boolean hasNext();
    E next();
    void remove(); 
}

一个类要实现Iterable接口,主要是实现iterator()方法,通过返回一个实现了Iterator接口的匿名内部类对象。例如:

public class IterablerClass<t> implements Iterable<t>{
      ......
    @Override
    public Iterator<t> iterator() {
        return new Iterator<t>() {
            private Integer index = 0;
            @Override
            publicboolean hasNext() {...}
            @Override
            public String  next(){...}
            @Override
            public void remove(){...}
         }
        ......
 }

1.1 Collection接口

Collection是最基本的集合接口,声明了适用于JAVA集合(只包括Set和List)的通用方法。 Set 和List 都继承了Collection。

1.1.1 Collection接口的方法:
  1. boolean add(Object o) :向集合中加入一个对象的引用
  2. void clear() :删除集合中所有的对象,即不再持有这些对象的引用
  3. boolean isEmpty() :判断集合是否为空
  4. boolean contains(Object o) : 判断集合中是否持有特定对象的引用
  5. Iterartor iterator() :返回一个Iterator对象,可以用来遍历集合中的元素
  6. boolean remove(Object o) :从集合中删除一个对象的引用
  7. int size() :返回集合中元素的数目
  8. Object[] toArray() : 返回一个数组,该数组中包括集合中的所有元素

关于:Iterator() 和toArray() 方法都用于集合的所有的元素,前者返回一个Iterator对象,后者返回一个包含集合中所有元素的数组。

1.1.2 Iterator接口声明了如下方法:

  1. hasNext() :判断集合中元素是否遍历完毕,如果没有,就返回true
  2. next() :返回下一个元素
  3. remove() :从集合中删除上一个有next()方法返回的元素。

1.2 List(列表)

List的特征是其元素以线性方式存储,集合中可以存放重复对象。

1.2.1 List接口主要实现类包括:

● ArrayList() : 代表长度可以改变得数组。可以对元素进行随机的访问,向ArrayList()中插入与删除元素的速度慢。
● LinkedList(): 在实现中采用链表数据结构。插入和删除速度快,访问速度慢。
对于List的随机访问来说,就是只随机来检索位于特定位置的元素。 List 的 get(int index) 方法放回集合中由参数index指定的索引位置的对象,下标从“0” 开始。最基本的两种检索集合中的所有对象的方法:
1: for循环和get()方法:

  for(int i=0; i < list.size();i++){  
     System.out.println(list.get(i));  
   }  

2: 使用 迭代器(Iterator):

   Iterator it=list.iterator();  
   while(it.hashNext()){  
      System.out.println(it.next());  
  }  

1.2.2 List的功能方法

实际上有两种List:一种是基本的ArrayList,其优点在于随机访问元素,另一种是更强大的LinkedList,它并不是为快速随机访问设计的,而是具有一套更通用的方法。
● List:次序是List最重要的特点:它保证维护元素特定的顺序。List为Collection添加了许多方法,使得能够向List中间插入与移除元素(这只推 荐LinkedList使用。)一个List可以生成ListIterator,使用它可以从两个方向遍历List,也可以从List中间插入和移除元 素。
● ArrayList:由数组实现的List。允许对元素进行快速随机访问,但是向List中间插入与移除元素的速度很慢。ListIterator只应该用来由后向前遍历 ArrayList,而不是用来插入和移除元素。因为那比LinkedList开销要大很多。
● LinkedList :对顺序访问进行了优化,向List中间插入与删除的开销并不大。随机访问则相对较慢。(使用ArrayList代替。)还具有下列方 法:addFirst(), addLast(), getFirst(), getLast(), removeFirst() 和 removeLast(), 这些方法 (没有在任何接口或基类中定义过)使得LinkedList可以当作堆栈、队列和双向队列使用。

1.3 Set(集合)

Set是最简单的一种集合。集合中的对象不按特定的方式排序,并且没有重复对象。 Set接口主要实现了两个实现类:
● HashSet: HashSet类按照哈希算法来存取集合中的对象,存取速度比较快
● TreeSet :TreeSet类实现了SortedSet接口,能够对集合中的对象进行排序,对象要实现comparable 或 comparator接口。
Set 的用法:存放的是对象的引用,没有重复对象

  Set set = new HashSet();  
  String s1 = new String("hello");  
  String s2 = s1;  
  String s3 = new String("world");  
  set.add(s1);  
  set.add(s2);  
  set.add(s3);  
  System.out.println(set.size());//打印集合中对象的数目 为 2。 

Set 的 add()方法是如何判断对象是否已经存放在集合中?

  boolean isExists=false;  
  Iterator iterator=set.iterator();  
  while(it.hasNext()){  
      String oldStr=it.next();  
      if(newStr.equals(oldStr)){   
          isExists=true;   
      }  
  } 

Set的功能方法
Set具有与Collection完全一样的接口,因此没有任何额外的功能,不像前面有两个不同的List。实际上Set就是Collection,只 是行为不同。(这是继承与多态思想的典型应用:表现不同的行为。)Set不保存重复的元素(至于如何判断元素相同则较为负责)
Set : 存入Set的每个元素都必须是唯一的,因为Set不保存重复元素。加入Set的元素必须定义equals()方法以确保对象的唯一性。Set与Collection有完全一样的接口。Set接口不保证维护元素的次序。
● HashSet:为快速查找设计的Set。存入HashSet的对象必须定义hashCode()。
● TreeSet: 保存次序的Set, 底层为树结构。使用它可以从Set中提取有序的序列。
● LinkedHashSet:具有HashSet的查询速度,且内部使用链表维护元素的顺序(插入的次序)。于是在使用迭代器遍历Set时,结果会按元素插入的次序显示。

1.HashSet的底层用哈希散列表来存储对象(默认长度为16的数组)

    Set set=new HashSet();
      set.add(obj);

内部存储过程为 : 定义h=obj.hashCode,得到obj对象的哈希码h,再对h进行hash散列运算,对数组长度进行求余,假如长度为16,则返回一个0-15之间的值,然后这个值就是存在HashSet数组中的下标。如果下标位置没有对象(不起冲突),则把obj加到该位置;如果已近有对象(起冲突),则用equals判断两对象是否相等,相等则舍弃obj,不相等,则把obj以节点(链表)的方式加在该对象下面。

2.HashSet是如何判断元素重复的
HashSet不能添加重复的元素,当调用add(Object)方法时候,首先会调用Object的hashCode方法判hashCode是否已经存在,如不存在则直接插入元素;如果已存在则调用Object对象的equals方法判断是否返回true,如果为true则说明元素已经存在,如为false则插入元素。
查看了JDK源码,发现HashSet竟然是借助HashMap来实现的,利用HashMap中Key的唯一性,来保证HashSet中不出现重复值。具体参见代码:

public class HashSet<E>
    extends AbstractSet<E>
    implements Set<E>, Cloneable, java.io.Serializable
{
    private transient HashMap<E,Object> map;
    private static final Object PRESENT = new Object();
    public HashSet() {
        map = new HashMap<E,Object>();
    }
    public boolean contains(Object o) {
        return map.containsKey(o);
    }
    public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }
}

由此可见,HashSet中的元素实际上是作为HashMap中的Key存放在HashMap中的。下面是HashMap类中的put方法:

public V put(K key, V value) {
    if (key == null)
        return putForNullKey(value);
    int hash = hash(key.hashCode());
    int i = indexFor(hash, table.length);
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }
}

从这段代码中可以看出,HashMap中的Key是根据对象的hashCode() 和 euqals()来判断是否唯一的。
结论:为了保证HashSet中的对象不会出现重复值,在被存放元素的类中必须要重写hashCode()和equals()这两个方法。

1.4 Map(映射)

Map 是一种把键对象和值对象映射的集合,它的每一个元素都包含一对键对象和值对象。 Map没有继承于Collection接口 从Map集合中检索元素时,只要给出键对象,就会返回对应的值对象。

1.4.1 Map 的常用方法:

1 添加,删除操作:
  Object put(Object key, Object value): 向集合中加入元素   
  Object remove(Object key): 删除与KEY相关的元素   
  void putAll(Map t):  将来自特定映像的所有元素添加给该映像   
  void clear():从映像中删除所有映射   
2 查询操作:

Object get(Object key):获得与关键字key相关的值 。Map集合中的键对象不允许重复,也就说,任意两个键对象通过equals()方法比较的结果都是false.,但是可以将任意多个键独享映射到同一个值对象上。

Map的功能方法
  1. 方法put(Object key, Object value) 添加一个“值”(想要得东西)和与“值”相关联的“键”(key)(使用它来查找)。
  2. 方法get(Object key) 返回与给定“键”相关联的“值”。可以用containsKey()和containsValue()测试Map中是否包含某个“键”或“值”。

标准的Java类库中包含了几种不同的Map:HashMap, TreeMap, LinkedHashMap, WeakHashMap, IdentityHashMap。它们都有同样的基本接口Map,但是行为、效率、排序策略、保存对象的生命周期和判定“键”等价的策略等各不相同。
执行效率是Map的一个大问题。看看get()要做哪些事,就会明白为什么在ArrayList中搜索“键”是相当慢的。而这正是HashMap提高速 度的地方。HashMap使用了特殊的值,称为“散列码”(hash code),来取代对键的缓慢搜索。“散列码”是“相对唯一”用以代表对象的int值,它是通过将该对象的某些信息进行转换而生成的。所有Java对象都 能产生散列码,因为hashCode()是定义在基类Object中的方法。
HashMap就是使用对象的hashCode()进行快速查询的。此方法能够显着提高性能。
● Map : 维护“键值对”的关联性,使你可以通过“键”查找“值”
● HashMap:Map基于散列表的实现。插入和查询“键值对”的开销是固定的。可以通过构造器设置容量capacity和负载因子load factor,以调整容器的性能。
● LinkedHashMap: 类似于HashMap,但是迭代遍历它时,取得“键值对”的顺序是其插入次序,或者是最近最少使用(LRU)的次序。只比HashMap慢一点。而在迭代访问时发而更快,因为它使用链表维护内部次序。
● TreeMap : 基于红黑树数据结构的实现。查看“键”或“键值对”时,它们会被排序(次序由Comparabel或Comparator决定)。TreeMap的特点在 于,你得到的结果是经过排序的。TreeMap是唯一的带有subMap()方法的Map,它可以返回一个子树。
● WeakHashMao :弱键(weak key)Map,Map中使用的对象也被允许释放: 这是为解决特殊问题设计的。如果没有map之外的引用指向某个“键”,则此“键”可以被垃圾收集器回收。
● IdentifyHashMap: : 使用==代替equals()对“键”作比较的hash map。专为解决特殊问题而设计。

1.5 其他特征

List,Set,Map将持有对象一律视为Object型别。
Collection、List、Set、Map都是接口,不能实例化。
继承自它们的 ArrayList, Vector, HashTable, HashMap是具象class,这些才可被实例化,Vector, HashTable是线程安全的,但效率比ArrayList,HashMap低。
vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。

总结

  1. 如果涉及到堆栈,队列等操作,应该考虑用List,对于需要快速插入,删除元素,应该使用LinkedList,如果需要快速随机访问元素,应该使用ArrayList。
  2. 如果程序在单线程环境中,或者访问仅仅在一个线程中进行,考虑非同步的类,其效率较高,如果多个线程可能同时操作一个类,应该使用同步的类。
  3. 在除需要排序时使用TreeSet,TreeMap外,都应使用HashSet,HashMap,因为他们 的效率更高。
  4. 要特别注意对哈希表的操作,作为key的对象要正确复写equals和hashCode方法。
  5. 容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。一旦将对象置入容器内,便损失了该对象的型别信息。
  6. 尽量返回接口而非实际的类型,如返回List而非ArrayList,这样如果以后需要将ArrayList换成LinkedList时,客户端代码不用改变。这就是针对抽象编程。

注意

  1. Collection没有get()方法来取得某个元素。只能通过iterator()遍历元素。
  2. Set和Collection拥有一模一样的接口。
  3. List,可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个,get(0)…。(add/get)
  4. 一般使用ArrayList。用LinkedList构造堆栈stack、队列queue。
  5. Map用 put(k,v) / get(k),还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。
    HashMap会利用对象的hashCode来快速找到key。
  6. Map中元素,可以将key序列、value序列单独抽取出来。
    使用keySet()抽取key序列,将map中的所有keys生成一个Set。
    使用values()抽取value序列,将map中的所有values生成一个Collection。
    为什么一个生成Set,一个生成Collection?那是因为,key总是独一无二的,value允许重复。

ListIterator和Iterator

  1. 使用范围不同,Iterator可以应用于所有的集合,Set、List和Map和这些集合的子类型。而ListIterator只能用于List及其子类型。
  2. ListIterator有add方法,可以向List中添加对象,而Iterator不能。
  3. ListIterator和Iterator都有hasNext()和next()方法,可以实现顺序向后遍历,但是ListIterator有hasPrevious()和previous()方法,可以实现逆向(顺序向前)遍历。Iterator不可以。
  4. ListIterator可以定位当前索引的位置,nextIndex()和previousIndex()可以实现。Iterator没有此功能。
  5. 都可实现删除操作,但是ListIterator可以实现对象的修改,set()方法可以实现。Iterator仅能遍历,不能修改。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值