Android List，Set，Map集合安全集合区别并发集合类性能分析

最新推荐文章于 2024-01-17 17:31:37 发布

ailinghao

最新推荐文章于 2024-01-17 17:31:37 发布

阅读量1.1k

点赞数

分类专栏： Android集合总结文章标签： Android 集合

Android集合总结专栏收录该内容

3 篇文章

订阅专栏

本文深入剖析了Java集合框架，包括List、Set和Map等主要接口及其实现类的特点与应用场景，特别强调了HashMap的工作原理及与其他映射类型的区别。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

对于Android开发者来说深入了解Java的集合类很有必要主要是从Collection和Map接口衍生出来的，目前主要提供了List、Set和 Map这三大类的集合

Collection接口主要有两种子类分别为List和Set，区别主要是List保存的对象可以重复

而Set不可以重复

而Map一般为key-value这样的对应关系，比如我们常用的HashMap。

数组

数组存储区间是连续的，占用内存严重，故空间复杂的很大。但数组的二分查找时间复杂度小，为O(1)；数组的特点是：寻址容易，插入和删除困难；

链表

链表存储区间离散，占用内存比较宽松，故空间复杂度很小，但时间复杂度很大，达O（N）。链表的特点是：寻址困难，插入和删除容易。

哈希表

那么我们能不能综合两者的特性，做出一种寻址容易，插入删除也容易的数据结构？答案是肯定的，这就是我们要提起的哈希表。哈希表（(Hash table）既满足了数据的查找方便，同时不占用太多的内容空间，使用也十分方便。

java中各种集合的关系图

Collection       接口的接口     对象的集合
├ List           子接口         按进入先后有序保存   可重复
│├ LinkedList    接口实现类     链表     插入删除   没有同步   线程不安全
│├ ArrayList     接口实现类     数组     随机访问   没有同步   线程不安全
│└ Vector        接口实现类     数组                  同步        线程安全
│ 　 └ Stack
└ Set            子接口       仅接收一次，并做内部排序

├ HashSet

│ 　 └ LinkedHashSet
└ TreeSet

List 主要有ArrayList、LinkedList、Vector和Stack

一、List 主要有ArrayList、LinkedList、Vector和Stack
有关这些子类的性能，Android开发网从插入、删除、移动等方面按照元素的执行效率做一一分析，通过分析Sun 的Java源码和实际元素操作得出下面结论:

ArrayList - 是线程不安全底层是由数组实现他的构造主要从AbstractList实现，主要是判断下初始元素的容量，ArrayList最大的特点就是提供了Add、Get操作，当然可以通过迭代器来遍历，对于元素的存在可以通过contains方法判断。

LinkedList - 线程不安全的作为一种双向链表结构，对于元素的插入、删除效率比较高，只需要调整节点指向即可，但是对于随机查找而言性能主要看这个链表长度和运气了。 LinkedList也提供了ArrayList的get方法，但是要复杂的多，主要通过next或previous方法遍历得到， LinkedList要移动指针。

Vector - 线程安全的，这两个类底层都是由数组实现的，效率低比较简单和ArrayList差不多，主要是内部实现了synchronized关键字，实现了线程安全访问但性能有些降低，同时对于元素的扩充在算法上和ArrayList稍有不同，通过构造的容量增量系数来决定。

Stack - 作为栈的操作，本次继承于Vector，提供了push，pop和peek方法，peek是不弹出根据数据大小获取最后一个元素对象。

二、Set 主要有HashSet 和 TreeSet

HashSet - 该类是从Set接口继承而来，相对于List而言就是说内部添加的元素不能重复， Hashtable 继承 Map 接口，实现一个 key-value 映射的哈希表。任何非空（ non-null ）的对象都可作为 key 或者 value 。　当然从名字的Hash来看就是通过哈希算法来实现防止冲突来获得防止重复的，整体上从HashMap实现，存放元素方法的也是类似key- value的对应的，通过迭代器遍历，不过HashSet不是线程安全的。

TreeSet - 这个相对于HashSet而言主要是提供了排序支持，TreeSet是从TreeMap类实现，也是非线程安全的。

可以看到Set的两个类都和Map有关，下面就一起看下有关映射(Map)相关的使用。

三、Map 主要有 HashMap 和 TreeMap

HashMap和Hashtable的区别

HashMap和Hashtable都实现了Map接口，但决定用哪一个之前先要弄清楚它们之间的分别。主要的区别有：线程安全性，同步(synchronization)，以及速度。

HashMap几乎可以等价于Hashtable，除了HashMap是非synchronized的，并可以接受null(HashMap可以接受为null的键值(key)和值(value)，而Hashtable则不行)。
HashMap是非synchronized，而Hashtable是synchronized，这意味着Hashtable是线程安全的，多个线程可以共享一个Hashtable；而如果没有正确的同步的话，多个线程是不能共享HashMap的。Java 5提供了ConcurrentHashMap，它是HashTable的替代，比HashTable的扩展性更好。
另一个区别是HashMap的迭代器(Iterator)是fail-fast迭代器，而Hashtable的enumerator迭代器不是fail-fast的。所以当有其它线程改变了HashMap的结构（增加或者移除元素），将会抛出ConcurrentModificationException，但迭代器本身的remove()方法移除元素则不会抛出ConcurrentModificationException异常。但这并不是一个一定发生的行为，要看JVM。这条同样也是Enumeration和Iterator的区别。
由于Hashtable是线程安全的也是synchronized，所以在单线程环境下它比HashMap要慢。如果你不需要同步，只需要单一线程，那么使用HashMap性能要好过Hashtable。
HashMap不能保证随着时间的推移Map中的元素次序是不变的。

HashMap - ，可以为空，提供了比较强大的功能实现，比如说loadFactor可以控制元素增长时内存分配，HashMap也是非线程安全的。

原理：

哈希表:由数组+链表组成的

HashMap类有一个叫做Entry的内部类。这个Entry类包含了key-value作为实例变量。我们来看下Entry类的结构。Entry类的结构：

 
    static 
    class 
    Entry 
    implements 
    Map.Entry 
   

{

 
    final 
    K key;

 
    V value;

 
    Entry next;

 
    final 
    int 
    hash;

 
    ... 
    //More code goes here

}

当新建一个HashMap的时候，就会初始化一个数组

transient Entry[] table;

static class Entry<K,V> implements Map.Entry<K,V> {
    final K key;
    V value;
    Entry<K,V> next;
    final int hash;
    ……
}

可以看出，Entry就是数组中的元素，每个 Map.Entry 其实就是一个key-value对，它持有一个指向下一个元素的引用，这就构成了链表。

在java编程语言中，最基本的结构就是两种，一个是数组，另外一个是模拟指针（引用），所有的数据结构都可以用这两个基本结构来构造的，HashMap也不例外。HashMap实际上是一个“链表散列”的数据结构，即数组和链表的结合体。

HashMap实现存储

 1 public V put(K key, V value) {
 2     // HashMap允许存放null键和null值。
 3     // 当key为null时，调用putForNullKey方法，将value放置在数组第一个位置。 4     if (key == null)
 5         return putForNullKey(value);
 6     // 根据key的keyCode重新计算hash值。 7     int hash = hash(key.hashCode());
 8     // 搜索指定hash值在对应table中的索引。 9     int i = indexFor(hash, table.length);
10     // 如果 i 索引处的 Entry 不为 null，通过循环不断遍历 e 元素的下一个元素。11     for (Entry<K,V> e = table[i]; e != null; e = e.next) {
12         Object k;
13         if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
14             // 如果发现已有该键值，则存储新的值，并返回原始值15             V oldValue = e.value;
16             e.value = value;
17             e.recordAccess(this);
18             return oldValue;
19         }
20     }
21     // 如果i索引处的Entry为null，表明此处还没有Entry。22     modCount++;
23     // 将key、value添加到i索引处。24     addEntry(hash, key, value, i);
25     return null;
26 }

关键方法： addEntry(hash, key, value, i);

当我们往HashMap中put元素的时候，先根据key的hashCode重新计算hash值，根据hash值得到这个元素在数组中的位置（即下标），如果数组该位置上已经存放有其他元素了，那么在这个位置上的元素将以链表的形式存放，新加入的放在链头，最先加入的放在链尾。如果数组该位置上没有元素，就直接将该元素放到此数组中的该位置上。

要牢记以下关键点：

HashMap有一个叫做Entry的内部类，它用来存储key-value对。
上面的Entry对象是存储在一个叫做table的Entry数组中。
table的索引在逻辑上叫做“桶”(bucket)，它存储了链表的第一个元素。
利用key的hashCode重新hash计算出当前对象的元素在数组中的下标
存储时，如果出现hash值相同的key，此时有两种情况。(1)如果key相同，则覆盖原始值；(2)如果key不同（出现冲突），则将当前的key-value放入链表中
获取时，直接找到hash值对应的下标，在进一步判断key是否相同，从而找到对应值。
理解了以上过程就不难明白HashMap是如何解决hash冲突的问题，核心就是使用了数组的存储方式，然后将冲突的key的对象放入链表中，一旦发现冲突就在链表中做进一步的对比。
TreeMap - 相对于HashMap它的排序可以通过传入包含comparator的属性来控制。

扩展类：

LinkedHashMap 类：

原理：双向环形链表

accessOrder主要对双向环形链表有影响，如果是true则表示双向环形链表按照访问的顺序存储，如果是false则表示按照插入的顺序存储，区别就是如果是插入顺序则双向环形链表的结构是不变的，如果是访问顺序则每次访问的时候比如get方法就会把get到的元素从链表中删除然后重新加到链表的尾部，因为尾部表示最新加入的，删除的时候是从头部开始删除，尾部是最后删除的，符合最近使用原则，

两个属性，nxt表示链表的下一个元素，prv表示链表的前一个元素

知道Head：然后pre和next可以得到最新和最老的元素!

使用ArrayMap/SparseArray而不是HashMap等传统数据结构

最近编程时，发现一个针对HashMap<Integer, E>的一个提示：

翻译过来就是：用SparseArray<E>来代替会有更好性能。
那我们就来看看源码中SparseArray到底做了哪些事情：