Android List,Set,Map集合安全 集合区别 并发集合类性能分析

对于Android开发者来说深入了解Java的集合类很有必要主要是从Collection和Map接口衍生出来的,目前主要提供了List、Set和 Map这三大类的集合

Collection接口主要有两种子类分别为List和Set,区别主要是List保存的对象可以重复
而Set不可以重复
而Map一般为key-value这样的对应关系,比如我们常用的HashMap。

 数组

数组存储区间是连续的,占用内存严重,故空间复杂的很大。但数组的二分查找时间复杂度小,为O(1);数组的特点是:寻址容易,插入和删除困难

链表

链表存储区间离散,占用内存比较宽松,故空间复杂度很小,但时间复杂度很大,达O(N)。链表的特点是:寻址困难,插入和删除容易。

哈希表

那么我们能不能综合两者的特性,做出一种寻址容易,插入删除也容易的数据结构?答案是肯定的,这就是我们要提起的哈希表。哈希表((Hash table既满足了数据的查找方便,同时不占用太多的内容空间,使用也十分方便。



java中各种集合的关系图  

Collection       接口的接口     对象的集合 
├ List           子接口         按进入先后有序保存   可重复 
│├ LinkedList    接口实现类     链表     插入删除   没有同步   线程不安全 
│├ ArrayList     接口实现类     数组     随机访问   没有同步   线程不安全 
│└ Vector        接口实现类     数组                  同步        线程安全 
│   └ Stack 
└ Set            子接口       仅接收一次,并做内部排序 

├ HashSet 

│   └ LinkedHashSet 
└ TreeSet
 

List 主要有ArrayList、LinkedList、Vector和Stack 
一、List 主要有ArrayList、LinkedList、Vector和Stack
有关这些子类的性能,Android开发网从插入、删除、移动等方面按照元素的执行效率做一一分析,通过分析Sun 的Java源码和实际元素操作得出下面结论:

        ArrayList - 是线程不安全 底层是由数组实现  他的构造主要从AbstractList实现,主要是判断下初始元素的容量,ArrayList最大的特点就是提供了Add、Get操作,当然可以通过迭代器来遍历,对于元素的存在可以通过contains方法判断。

       LinkedList -  线程不安全的  作为一种双向链表结构,对于元素的插入、删除效率比较高,只需要调整节点指向即可,但是对于随机查找而言性能主要看这个链表长度和运气了。 LinkedList也提供了ArrayList的get方法,但是要复杂的多,主要通过next或previous方法遍历得到, LinkedList要移动指针

       Vector - 线程安全的,这两个类底层都是由数组实现的,效率低   比较简单和ArrayList差不多,主要是内部实现了synchronized关键字,实现了线程安全访问但性能有些降低,同时对于元素的扩充在算法上和ArrayList稍有不同,通过构造的容量增量系数来决定。

       Stack - 作为栈的操作,本次继承于Vector,提供了push,pop和peek方法,peek是不弹出根据数据大小获取最后一个元素对象。

  二、Set 主要有HashSet 和 TreeSet 

  HashSet - 该类是从Set接口继承而来,相对于List而言就是说内部添加的元素 不能重复   Hashtable 继承 Map 接口,实现一个 key-value 映射的哈希表。任何非空( non-null )的对象都可作为 key 或者 value 。   当然从名字的Hash来看就是通过哈希算法来实现防止冲突来获得防止重复的,整体上从HashMap实现,存放元素方法的也是类似key- value的对应的,通过迭代器遍历,不过HashSet不是线程安全的。  

  TreeSet - 这个相对于HashSet而言主要是提供了排序支持,TreeSet是从TreeMap类实现,也是非线程安全的。 

  可以看到Set的两个类都和Map有关,下面就一起看下有关映射(Map)相关的使用。 

  三、Map 主要有 HashMap 和 TreeMap 


HashMap和Hashtable的区别

HashMap和Hashtable都实现了Map接口,但决定用哪一个之前先要弄清楚它们之间的分别。主要的区别有:线程安全性,同步(synchronization),以及速度。

  1. HashMap几乎可以等价于Hashtable,除了HashMap是非synchronized的,并可以接受null(HashMap可以接受为null的键值(key)和值(value),而Hashtable则不行)。
  2. HashMap是非synchronized,而Hashtable是synchronized,这意味着Hashtable是线程安全的,多个线程可以共享一个Hashtable;而如果没有正确的同步的话,多个线程是不能共享HashMap的。Java 5提供了ConcurrentHashMap,它是HashTable的替代,比HashTable的扩展性更好。
  3. 另一个区别是HashMap的迭代器(Iterator)是fail-fast迭代器,而Hashtable的enumerator迭代器不是fail-fast的。所以当有其它线程改变了HashMap的结构(增加或者移除元素),将会抛出ConcurrentModificationException,但迭代器本身的remove()方法移除元素则不会抛出ConcurrentModificationException异常。但这并不是一个一定发生的行为,要看JVM。这条同样也是Enumeration和Iterator的区别。
  4. 由于Hashtable是线程安全的也是synchronized,所以在单线程环境下它比HashMap要慢。如果你不需要同步,只需要单一线程,那么使用HashMap性能要好过Hashtable。
  5. HashMap不能保证随着时间的推移Map中的元素次序是不变的。


  HashMap - , 可以为空 ,提供了比较强大的功能实现,比如说loadFactor可以控制元素增长时内存分配,HashMap也是非线程安全的。 

原理:



哈希表:由数组+链表组成的 


HashMap类有一个叫做Entry的内部类。这个Entry类包含了key-value作为实例变量。我们来看下Entry类的结构。Entry类的结构:

static class Entry implements Map.Entry
{
         final K key;
         V value;
         Entry next;
         final int hash;
         ... //More code goes here
}  

当新建一个HashMap的时候,就会初始化一个数组

transient Entry[] table;

static class Entry<K,V> implements Map.Entry<K,V> {
    final K key;
    V value;
    Entry<K,V> next;
    final int hash;
    ……
}
可以看出,Entry就是数组中的元素,每个 Map.Entry 其实就是一个key-value对,它持有一个指向下一个元素的引用,这就构成了链表。

 在java编程语言中,最基本的结构就是两种,一个是数组,另外一个是模拟指针(引用),所有的数据结构都可以用这两个基本结构来构造的,HashMap也不例外。HashMap实际上是一个“链表散列”的数据结构,即数组和链表的结合体。

HashMap实现存储

 1 public V put(K key, V value) {
 2     // HashMap允许存放null键和null值。
 3     // 当key为null时,调用putForNullKey方法,将value放置在数组第一个位置。 4     if (key == null)
 5         return putForNullKey(value);
 6     // 根据key的keyCode重新计算hash值。 7     int hash = hash(key.hashCode());
 8     // 搜索指定hash值在对应table中的索引。 9     int i = indexFor(hash, table.length);
10     // 如果 i 索引处的 Entry 不为 null,通过循环不断遍历 e 元素的下一个元素。11     for (Entry<K,V> e = table[i]; e != null; e = e.next) {
12         Object k;
13         if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
14             // 如果发现已有该键值,则存储新的值,并返回原始值15             V oldValue = e.value;
16             e.value = value;
17             e.recordAccess(this);
18             return oldValue;
19         }
20     }
21     // 如果i索引处的Entry为null,表明此处还没有Entry。22     modCount++;
23     // 将key、value添加到i索引处。24     addEntry(hash, key, value, i);
25     return null;
26 }
复制代码

关键方法: addEntry(hash, key, value, i);
当我们往HashMap中put元素的时候,先根据key的hashCode重新计算hash值,根据hash值得到这个元素在数组中的位置(即下标),如果数组该位置上已经存放有其他元素了,那么在这个位置上的元素将以链表的形式存放,新加入的放在链头,最先加入的放在链尾。如果数组该位置上没有元素,就直接将该元素放到此数组中的该位置上。


要牢记以下关键点:

  • HashMap有一个叫做Entry的内部类,它用来存储key-value对。
  • 上面的Entry对象是存储在一个叫做table的Entry数组中
  • table的索引在逻辑上叫做“桶”(bucket),它存储了链表的第一个元素。
  •  利用key的hashCode重新hash计算出当前对象的元素在数组中的下标 
  • 存储时,如果出现hash值相同的key,此时有两种情况。(1)如果key相同,则覆盖原始值;(2)如果key不同(出现冲突),则将当前的key-value放入链表中
  • 获取时,直接找到hash值对应的下标,在进一步判断key是否相同,从而找到对应值。
  • 理解了以上过程就不难明白HashMap是如何解决hash冲突的问题,核心就是使用了数组的存储方式,然后将冲突的key的对象放入链表中,一旦发现冲突就在链表中做进一步的对比。

  •  TreeMap - 相对于HashMap它的排序可以通过传入包含comparator的属性来控制。 


扩展类:

 LinkedHashMap 类:
 原理: 双向环形链表



accessOrder主要对双向环形链表有影响,如果是true则表示双向环形链表按照访问的顺序存储,如果是false则表示按照插入的顺序存储,区别就是如果是插入顺序则双向环形链表的结构是不变的, 如果是访问顺序则每次访问的时候比如get方法就会把get到的元素从链表中删除然后重新加到链表的尾部,因为尾部表示最新加入的,删除的时候是从头部开始删除,尾部是最后删除的,符合最近使用原则,

两个属性,nxt表示链表的下一个元素,prv表示链表的前一个元素
知道Head:然后pre和next可以得到最新和最老的元素!

使用ArrayMap/SparseArray而不是HashMap等传统数据结构

最近编程时,发现一个针对HashMap<Integer, E>的一个提示:


翻译过来就是:用SparseArray<E>来代替会有更好性能。
那我们就来看看源码中SparseArray到底做了哪些事情:


并发包集合类

1). BlockingQueue

  • ArrayBlockingQueue :一个由数组支持的有界队列。
  • LinkedBlockingQueue :一个由链接节点支持的可选有界队列。
  • PriorityBlockingQueue :一个由优先级堆支持的无界优先级队列。
  • DelayQueue :一个由优先级堆支持的、基于时间的调度队列。
  • SynchronousQueue :一个利用 BlockingQueue 接口的简单聚集(rendezvous)机制。

2).ConcurrentMap

putIfAbsent()  方法是原子的

等价的 putIfAbsent() 代码
  if (!map.containsKey(key)) {
    return map.put(key, value);
  } else {
    return map.get(key);
  }


3).使用 CopyOnWriteArrayList 和 CopyOnWriteArraySet


Evenbus源码里面有用到这个玩意

总结:区别和比较

5.HashMap和 HashTable 的区别:

HashTable比较老,是基于Dictionary 类实现的,HashTable 则是基于 Map接口实现的 
HashTable 是线程安全的, HashMap 则是线程不安全的 
HashMap可以让你将空值作为一个表的条目的key或value




HashMap的原理


  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值