关闭

数组的分类以及应用

标签: Collection 数组
330人阅读 评论(0) 收藏 举报
分类:

                                                                                       

                 Collection                                     

                                                                                                         

Collection

                                                               ├List                  └Set                                              Map           

                                                                    

                                  |  LinkedList                                       ├Hashtable

                                | ArrayList                                           ├HashMap

                                               │└Vector                                           └WeakHashMap 





  是最基本的集合接口,一个Collection代表一组Object,即Collection的元素(Elements)。子接口:List和Set...........

  所有实现Collection接口的类都必须提供两个标准的构造函数:无参数的构造函数用于创建一个空的Collection,有一个Collection参数的构造函数用于创建一个新的Collection,这个新的Collection与传入的Collection有相同的元素。后一个构造函数允许用户复制一个Collection。

            List  

       1、 是有序的Collection,使用此接口能够精确的控制每个元素插入的位置。用户能够使用索引来访问list中的元素

       2、允许有相同的元素,除了具有Collection接口必备的iterator()方法外,List还提供一个listIterator()方法,返回一个 

            ListIterator接口,和标准的Iterator接口相比,ListIterator多了一些add()之类的方法,允许添加,删除,设定元素,

            还能向前或向后遍历。 

       Vector、 ArrayList

       1、 采用数组方式存储数据,此数组元素数大于实际存储的数据以便增加和插入元素,允许序号索引元素,但查入数

            据要设计到数组元素的移动等内存操作,故索引数据快插入数据源慢

      2、  Vector由于使用了线程安全(synchronized),所以性能比ArrayList要差

     3、允许null元素;

       LinkedList                                              

   1、 使用双向链表进行存储,按序号索引数据需要进行向前或者向后遍历,但是插入数据时只需 要记住本项的前后项即可

          故插入速度块。和ArrayList一样都是线程不安全的                                                                  

   2、 LinkedList实现了List接口,允许null元素。此外LinkedList提供额外的get,remove,insert方法在LinkedList的首部或尾部。

          这 些 操作使LinkedList可被用作堆栈(stack),队列(queue)或双向队列(deque)。

  注意LinkedList没有同步方法。如果多个线程同时访问一个List,则必须自己实现访问同步。一种解决方法是在创建List时构造一        个同步的List:

    List list =Collections.synchronizedList(new LinkedList(...));

      ArrayList    

    ArrayList实现了可变大小的数组。它允许所有元素,包括null。

    size,isEmpty,get,set方法运行时间为常数。但是add方法开销为分摊的常数,添加n个元素需要O(n)的时间。其他的方法运行       时间为线性。

 每个ArrayList实例都有一个容量(Capacity),即用于存储元素的数组的大小。这个容量可随着不断添加新元素而自动增加,但        是增长算法并没有定义。当需要插入大量元素时,在插入前可以调用ensureCapacity方法来增加ArrayList的容量以提高插入效率。


      Set   

     Set是一种不包含重复的元素的Collection,即任意的两个元素e1和e2都有e1.equals(e2)=false,Set最多有一个null元素。

 很明显,Set的构造函数有一个约束条件,传入的Collection参数不能包含重复的元素。 


   

     Map接口

 Map没有继承Collection接口,Map提供key到value的映射。一个Map中不能包含相同的key,每个key只能映射一个value。Map接口提供3种集合的视图,Map的内容可以被当作一组key集合,一组value集合,或者一组key-value映射。

       

 Hashtable继承Map接口,实现一个key-value映射的哈希表。任何非空(non-null)的对象都可作为key或者value。

 添加数据使用put(key,value),取出数据使用get(key),这两个基本操作的时间开销为常数。

    Hashtable通过initialcapacity和load factor两个参数调整性能。通常缺省的load factor 0.75较好地实现了时间和空间的均衡。增大         load factor可以节省空间但相应的查找时间将增大,这会影响像get和put这样的操作。 

   

    

        Hashtablenumbers = new Hashtable();

    numbers.put(“one”,new Integer(1));

    numbers.put(“two”,new Integer(2));

    numbers.put(“three”,new Integer(3));

  要取出一个数,比如2,用相应的key:

  Integer n= (Integer)numbers.get(“two”); 

    

     HashMap类

  HashMap和Hashtable类似,不同之处在于HashMap是非同步的,并且允许null,即nullvalue和null key。,但是将HashMap视为          Collection时(values()方法可返回Collection),其迭代子操作时间开销和HashMap的容量成比例。因此,如果迭代操作的性能          相 当重要的话,不要将HashMap的初始化容量设得过高,或者loadfactor过低。


   

     WeakHashMap类

   WeakHashMap是一种改进的HashMap,它对key实行“弱引用”,如果一个key不再被外部所引用,那么该key可以被GC回收。 

  

    

             总结

  如果涉及到堆栈,队列等操作,应该考虑用List,对于需要快速插入,删除元素,应该使用LinkedList,如果需要快速随机访问     元素,应该使用ArrayList。

  如果程序在单线程环境中,或者访问仅仅在一个线程中进行,考虑非同步的类,其效率较高,如果多个线程可能同时操作一个   类,应该使用同步的类。

  要特别注意对哈希表的操作,作为key的对象要正确复写equals和hashCode方法。

  尽量返回接口而非实际的类型,如返回List而非ArrayList,这样如果以后需要将ArrayList换成LinkedList时,客户端代码不用改变。这就是针对抽象编程。

 

同步性

Vector是同步的。这个类中的一些方法保证了Vector中的对象是线程安全的。而ArrayList则是异步的,因此ArrayList中的对象并不是线程安全的。因为同步的要求会影响执行的效率,所以如果你不需要线程安全的集合那么使用ArrayList是一个很好的选择,这样可以避免由于同步带来的不必要的性能开销。

数据增长

从内部实现机制来讲ArrayList和Vector都是使用数组(Array)来控制集合中的对象。当你向这两种类型中增加元素的时候,如果元素的数目超出了内部数组目前的长度它们都需要扩展内部数组的长度,Vector缺省情况下自动增长原来一倍的数组长度,ArrayList是原来的50%,所以最后你获得的这个集合所占的空间总是比你实际需要的要大。所以如果你要在集合中保存大量的数据那么使用Vector有一些优势,因为你可以通过设置集合的初始化大小来避免不必要的资源开销。

使用模式

在ArrayList和Vector中,从一个指定的位置(通过索引)查找数据或是在集合的末尾增加、移除一个元素所花费的时间是一样的,这个时间我们用O(1)表示。但是,如果在集合的其他位置增加或移除元素那么花费的时间会呈线形增长:O(n-i),其中n代表集合中元素的个数,i代表元素增加或移除元素的索引位置。为什么会这样呢?以为在进行上述操作的时候集合中第i和第i个元素之后的所有元素都要执行位移的操作。这一切意味着什么呢?

这意味着,你只是查找特定位置的元素或只在集合的末端增加、移除元素,那么使用Vector或ArrayList都可以。如果是其他操作,你最好选择其他的集合操作类。比如,LinkList集合类在增加或移除集合中任何位置的元素所花费的时间都是一样的?O(1),但它在索引一个元素的使用缺比较慢-O(i),其中i是索引的位置.使用ArrayList也很容易,因为你可以简单的使用索引来代替创建iterator对象的操作。LinkList也会为每个插入的元素创建对象,所有你要明白它也会带来额外的开销。

最后,在《PracticalJava》一书中Peter Haggar建议使用一个简单的数组(Array)来代替Vector或ArrayList。尤其是对于执行效率要求高的程序更应如此。因为使用数组(Array)避免了同步、额外的方法调用和不必要的重新分配空间的操作


  

     

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:24864次
    • 积分:398
    • 等级:
    • 排名:千里之外
    • 原创:12篇
    • 转载:28篇
    • 译文:0篇
    • 评论:1条
    最新评论