Java 集合类1-CSDN博客

本文链接：https://blog.csdn.net/weixin_44179010/article/details/125377814

Java中有哪些容器（集合类）？

Java集合类主要由Collectiont接口和 Map接口派生。 Collection接口派生出Set、List、Queue接口。
四个接口分为四大类集合： Set表示无序集合、List有序集合、Queue先进先出队列、Map 键值对集合
这些接口常见是实现类有HashSet、TreeSet、ArrayList、 LinkedList、 ArrayDeque、HashMap、 TreeMap

Java容器中线程安全和线程不安全的集合类

安全的只有Vector、Hashtable。比较古老、性能很差
不如用Collections工具类的synchronizedCollection()方法，把不安全的集合类包装成安全的集合类
JDK5开始引入了concurrent包，提供了大量支持高效并发访问的集合类，既能保证线程安全，又能保证良好的访问性能。

Map接口的实现类及区别

HashMap、 LinkedHashMap、TreeMap、ConcurrenHashMap
HashMap 和 LinedHashMap 键值能存 null ，其他的不行
对于不需要排序的场景，优先使用HashMap，如果需要线程安全可以用ConcurrentHashMap，其性能好于Hashtable。

对于需要记住插入顺序的场景用LinkedHashMap、对于需要Key排序的场景选中TreeMap，
如果需要线程安全也可以用Collections工具类将上述实现类包装成安全的Map

HashMap源码分析

HashMap的底层数据结构是数组+链表，如果链表长度达到8，链表会转化为红黑树
底层使用Set集合存储entry

put 源码及存储过程分析

    public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }
 
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

map的存储过程为：

首先获取Node数组 table对象，如果table为null则调用resize()扩容
计算索引下标，判断数组指定索引下的节点是否为null，如果为null就new 出来一个单向链表赋值给这个节点
若索引下标节点不为null，判断此节点的key与插入key是否相等，先判断hash再判断equals，相同直接替换
如果不同的话就看看节点是不是红黑树，是的话用红黑树的插入
不是红黑树，也不同就遍历节点插入，如果插入后链表节点数大于8，就把链表变成红黑树。
最后判定数组需不需要扩容，需要的话就进行resize()

hash值计算

    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

HashMap计算Hash值不是简单的直接用Object的Hash值，而是将这个Hash值异或上它无符号右移16位 h = hahsCode() ^ (h >>>16)
也就是把HashCode的高16位移位到第位进行异或运算。这样做的原因是HashCode的差异主要再高位，而通过hash值计算索引位置时会忽略掉高位信息，所有用异或把高位信息也保存下来，减少hash碰撞

索引计算

(n - 1) & hash

这么做使得计算出的索引一定在数组界限内

扩容 resize() 方法

触发扩容的三个条件： ①数组为空、②链表长度达到8，且数组长度小于64 则扩容、 ③数组中元素超过阈值（默认0.75）则扩容

扩容过程：

判断数组大小是否到了极限默认 2的30次方，到极限了就不扩容了
如果老数组为空就扩容就扩为初始容量，否则就扩两倍，因为用位移计算容量效率很高
扩容完之后需要迁移数据，所有元素重新分配，在迁移数据的过程中，不会重新计算每一个key的Hash值，如果hash值 & 旧数组大小等于0，索引不变，
如果为1 新索引为旧索引+旧数组大小。这样由于新产生的一位是0或者是1 是随机的，这样就把产生冲突的节点均匀分布到新的槽里了

为什么用红黑树，不用二叉树或B树

B/B+树多用于外存上
HashMap本来是数组+链表的形式，链表由于其查找慢的特点，所以需要被查找效率更高的树结构来替
换。
如果用二叉树的话，极端情况二叉树只有一边子树可能会变成单链表的形状。
如果用B/B+树的话，在数据量不是很多的情况下，数据都会“挤在”一个结点里面，这个时候遍历效率就退化成了链表。