HashMap源码分析整理（1.8）

最新推荐文章于 2021-09-14 16:01:41 发布

lin734196912

最新推荐文章于 2021-09-14 16:01:41 发布

阅读量106

点赞数

分类专栏： Java 集合

本文链接：https://blog.csdn.net/lin734196912/article/details/103792038

版权

Java 同时被 2 个专栏收录

5 篇文章 0 订阅

订阅专栏

集合

1 篇文章 0 订阅

订阅专栏

结构

HashMap中的变量及含义

// 默认初始容量，必须是2的n次幂
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
// 最大容量，满足2的n次幂的同时，小于等于此值
static final int MAXIMUM_CAPACITY = 1 << 30;
// 默认负载因子，决定map的扩容时机
static final float DEFAULT_LOAD_FACTOR = 0.75f;
// 链表转红黑树阈值，单链表长度达到此值时转为红黑树
static final int TREEIFY_THRESHOLD = 8;
// 红黑树转链表的阈值，红黑树的节点数小于此值时红黑树还原成单链表
static final int UNTREEIFY_THRESHOLD = 6;
// 链表转红黑树的另一个约束条件，如果需要转红黑树时，map容量小于此值，则优先进行resize扩容
static final int MIN_TREEIFY_CAPACITY = 64;
// 第一次使用的时候初始化，必要的时候扩容. 当分配完，大小始终是2的n次幂.
transient Node<K,V>[] table;
// 缓存entrySet()的结果
transient Set<Map.Entry<K,V>> entrySet;
// map大小
transient int size;
// 对map的操作次数
transient int modCount;
// 扩容阈值，根据容量*负载因子计算
int threshold;
// 负载因子
final float loadFactor;

存入map中的所有key value都会封装成一个Node对象来存储，当产生hash冲突时，形成单向链表，next指向下一个元素

static class Node<K,V> implements Map.Entry<K,V> {
    final int hash;
    final K key;
    V value;
    Node<K,V> next;

当单链表需要转成红黑树来存储时，Node会换成TreeNode

static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
    TreeNode<K,V> parent;  // red-black tree links
    TreeNode<K,V> left;
    TreeNode<K,V> right;
    TreeNode<K,V> prev;    // needed to unlink next upon deletion
    boolean red;

HashMap使用Node数组来存放元素

transient Node<K,V>[] table;

操作

put操作

1.计算hash

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

当调put方法存放元素至map中时，先根据key计算hash值；如果key值是null时直接返回0，如果不是null则让hashCode的低16位异或上高16位，让高低位都参与到计算中来，增加散列效果

2.计算元素位置

p = tab[i = (n - 1) & hash])

通过key计算出hash之后，由hash值与上数组下标的最大值，来计算当前元素在数组中的位置。如果返回0，则永远在数组中index=0的这个位置，即key为null值得元素存放在数组的第一个位置；当key不是null时，因为HashMap的大小始终是2的n次幂，所以n-1的二进制全部是1，与上hash之后的结果完全取决于hash的后几位。

3.判断是否初始化

if ((tab = table) == null || (n = tab.length) == 0)
    n = (tab = resize()).length;

执行put操作之前，判断map的数组是否执行了初始化，如果没有，则调用resize方法执行容量从0至初始容量的扩容操作

4.目标位置没有元素

if ((p = tab[i = (n - 1) & hash]) == null)
    tab[i] = newNode(hash, key, value, null);

当目标位置没有元素时，直接将key、value封装成Node对象之后存放在目标位置

5.目标位置存在元素且满足"==“或"equals”

if (p.hash == hash &&
    ((k = p.key) == key || (key != null && key.equals(k))))
    e = p;

当目标位置存在元素时，如果目标位置元素的hash值与当前存放的key的hash值一样，且key值满足 “==” 或 “equals”，则替换元素的值，并将旧值返回

6.目标位置元素是红黑树

else if (p instanceof TreeNode)
    e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

如果目标位置元素的key与当前key值不满足"==" 或 “equals”，且是以红黑树结构存储(以hash值大小来维护红黑树)，则从树中逐级查找是否存在节点满足"==“和"equals”，如果存在，则将值替换后返回旧值，如果不存在则在原来的树种新增节点

7.目标位置是单链表

for (int binCount = 0; ; ++binCount) {
   if ((e = p.next) == null) {
        p.next = newNode(hash, key, value, null);
        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
            treeifyBin(tab, hash);
        break;
    }
    if (e.hash == hash &&
        ((k = e.key) == key || (key != null && key.equals(k))))
        break;
    p = e;
}

如果目标位置存放的是链表，则从链表头向后查找满足"=="和"equals"的元素替换其值并返回旧值，如果找不到则新增节点到链表尾端，此时如果链表长度到达链表转红黑树的阈值（默认是8），则将链表以hash值大小为基准构建红黑树

如果本次put操作是替换操作，直接返回旧值；如果是新增操作，会在返回前递增modCount和size并检查扩容阈值threshold，如果size超过了阈值，需要扩容，调resize方法，将容量从2的n次幂扩至2的n+1次幂

get操作

计算hash

public V get(Object key) {
    Node<K,V> e;
    return (e = getNode(hash(key), key)) == null ? null : e.value;
}

查找元素

final Node<K,V> getNode(int hash, Object key) {
    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
        if (first.hash == hash && // always check first node
            ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        if ((e = first.next) != null) {
            if (first instanceof TreeNode)
                return ((TreeNode<K,V>)first).getTreeNode(hash, key);
            do {
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    return null;
}

1.如果目标位置不存在元素直接返回null
2.如果目标位置存在元素，且满足"==" 或 “equals”，返回这个元素
3.如果目标位置存在元素，且是红黑树结构，依据hash值的大小，在树中查找元素满足"==" 或 “equals"的元素并返回，否则返回null
4.如果目标位置存在元素，且是单链表结构，从头节点向尾端遍历，直到找到满足”==" 或 "equals"的元素返回，否则返回null

remove操作

计算hash

public boolean remove(Object key, Object value) {
    return removeNode(hash(key), key, value, true, true) != null;
}

查找元素

if ((tab = table) != null && (n = tab.length) > 0 &&
    (p = tab[index = (n - 1) & hash]) != null) {
    Node<K,V> node = null, e; K k; V v;
    if (p.hash == hash &&
        ((k = p.key) == key || (key != null && key.equals(k))))
        node = p;
    else if ((e = p.next) != null) {
        if (p instanceof TreeNode)
            node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
        else {
            do {
                if (e.hash == hash &&
                    ((k = e.key) == key ||
                     (key != null && key.equals(k)))) {
                    node = e;
                    break;
                }
                p = e;
            } while ((e = e.next) != null);
        }
    }

查找流程跟get操作一样，如果找不到元素，返回null；如果找到元素，检查元素的value是否跟传递进来的value值一样，如果一样，分情况进行删除

if (node != null && (!matchValue || (v = node.value) == value ||
    (value != null && value.equals(v)))) {
    if (node instanceof TreeNode)
        ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
    else if (node == p)
        tab[index] = node.next;
    else
        p.next = node.next;
    ++modCount;
    --size;
    afterNodeRemoval(node);
    return node;
}

1.如果找到的元素是红黑树的节点，调TreeNode.removeTreeNode方法删除节点
2.如果找到的元素是单独元素或者单链表的头节点，直接将元素的next指向的元素存到数组中
3.如果是单链表的非头节点，将被删元素的前一个节点的next指针，指向被删元素的后一个节点

扩容

初始容量

调用HashMap的无参数构造器时，默认的数组大小为16

// 16
newCap = DEFAULT_INITIAL_CAPACITY;
// 0.75f * 16
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);

HashMap的大小是有上限的，MAXIMUM_CAPACITY = 2^30

static final int MAXIMUM_CAPACITY = 1 << 30;

调用指定初始容量的构造器时，根据指定的初始容量，计算出比这个容量大的最小2的n次幂，下面这个算法就是为了找到最小2的n次幂。比如，当cap = 9时，n = cap - 1 = 8 = 1000，n >>> 1 = 0100，n |= n >>> 1结果为n=1100，n >>> 2 = 0011，n |= n >>> 2结果为1111，1111 = 15，15 + 1 = 16，所以实际初始大小为16。所以这个算法就是为了把二进制32位以内的所有位都变成1，结果即 2^n - 1。

为什么HashMap的大小必须为2的n次幂呢，因为通过hash值与上size-1来计算下标位置，如果size不是2的n次幂，比如15，15的二进制表示为1111，那么数组下标的最大值为1110，hash值与1110做与运算，永远得不到0001，0011，0101，1001，0111，1011，1101这几个值，即数组的1、3、5、7、9、11、13都不会有值存放，不但浪费了空间，存同样数量元素，哈希碰撞的几率也更大，也就意味着链表（或红黑树）长度大，查询速度效率低

static final int tableSizeFor(int cap) {
    int n = cap - 1;
    n |= n >>> 1;
    n |= n >>> 2;
    n |= n >>> 4;
    n |= n >>> 8;
    n |= n >>> 16;
    return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}

当HashMap创建完成之后，并没有初始化table数组，而是在第一次存放元素的时候才会通过resize方法执行初始化操作

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
           boolean evict) {
    // 省略
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    // 省略

负载因子

负载因子默认为0.75f，可以通过构造器指定负载因子

static final float DEFAULT_LOAD_FACTOR = 0.75f;

负载因子决定threshold的大小，向map中put元素时，会检查大小递增后是否超过了阈值threshold，如果超过了，则需要扩容

if (++size > threshold)
    resize();

扩容迁移

当一个非空的map执行扩容时，原来元素在新数组中的位置可能需要重新计算了；因为HashMap的位置确定是通过hash & size - 1，扩容前后size - 1的区别仅仅是最高位的1，比如扩容前8 - 1 = 111，扩容后16 - 1 = 1111，假如hash的第四位为0时，那么hash & 111 和 hash & 1111的结果是一样的，也就是说计算出的元素位置是一样的，那么只要满足 hash & 1000 = 0，下标就不需要重新计算，1000恰好是扩容前的大小；如果 hash & 1000 = 1，那么hash & 111 和 hash & 1111的结果相差1000，即原index + 1000为新的位置。

if (oldTab != null) {
	for (int j = 0; j < oldCap; ++j) {
	    Node<K,V> e;
	    if ((e = oldTab[j]) != null) {
	        oldTab[j] = null;
	        if (e.next == null)
	            newTab[e.hash & (newCap - 1)] = e;
	        else if (e instanceof TreeNode)
	            ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
	        else { // preserve order
	            Node<K,V> loHead = null, loTail = null;
	            Node<K,V> hiHead = null, hiTail = null;
	            Node<K,V> next;
	            do {
	                next = e.next;
	                if ((e.hash & oldCap) == 0) {
	                    if (loTail == null)
	                        loHead = e;
	                    else
	                        loTail.next = e;
	                    loTail = e;
	                }
	                else {
	                    if (hiTail == null)
	                        hiHead = e;
	                    else
	                        hiTail.next = e;
	                    hiTail = e;
	                }
	            } while ((e = next) != null);
	            if (loTail != null) {
	                loTail.next = null;
	                newTab[j] = loHead;
	            }
	            if (hiTail != null) {
	                hiTail.next = null;
	                newTab[j + oldCap] = hiHead;
	            }
	        }
	    }
	}
	}

从数组的第一个元素开始向后遍历，根据元素的类型是链表还是红黑树来分情况处理：

元素既非链表也非红黑树，直接计算新的位置赋值
元素为单链表，遍历单链表，通过hash & oldCap结果是否0拆分为两个链表，为0时下标仍然为index，结果为1时下标为index + oldCap
元素为红黑树，遍历红黑树通过hash & oldCap结果是否0拆分为两条单链表，如果拆分后的链表长度仍满足红黑树要求，则重建红黑树，如不满足，将TreeNode替换为Node，还原成单链表