HashMap源码解读

最新推荐文章于 2024-07-14 19:56:17 发布

墨鱼的s我

最新推荐文章于 2024-07-14 19:56:17 发布

阅读量22

点赞数

分类专栏： java集合文章标签：哈希算法算法 java hash table

本文链接：https://blog.csdn.net/m0_64509386/article/details/133310997

版权

java集合专栏收录该内容

1 篇文章 0 订阅

订阅专栏

HashMap详解

get(Object key) 源码解析

public V get(Object key) {
    Node<K,V> e;
    return (e = getNode(hash(key), key)) == null ? null : e.value;
}

可以看到主要是调用了 getNode() 方法

final Node<K,V> getNode(int hash, Object key) {
    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    if ((tab = table) != null && (n = tab.length) > 0 &&	// 1
        (first = tab[(n - 1) & hash]) != null) {
        if (first.hash == hash && // always check first node	// 2
            ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        if ((e = first.next) != null) {		// 3
            if (first instanceof TreeNode)	// 4
                return ((TreeNode<K,V>)first).getTreeNode(hash, key);
            do {							// 5
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    return null;
}

对输入的hash进行判断，是否对应的哈希槽存在。（n-1）是hash槽的大小减一，与输入的hash相与可以得到在hash槽的下标。
判断找到的hash槽第一个节点是不是要找的节点
判断找到的第一个节点是否存在子节点
判断是否已经转为了红黑树，如果已经是红黑树则直接通过相应方法获取节点
不是红黑树则是链表，遍历链表找到相应节点

putVal() 源码解析

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)	// 1
        n = (tab = resize()).length;
    if ((p = tab[i = (n - 1) & hash]) == null)		//	2
        tab[i] = newNode(hash, key, value, null);
    else {
        Node<K,V> e; K k;
        if (p.hash == hash &&						// 3
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        else if (p instanceof TreeNode)				// 4
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
            for (int binCount = 0; ; ++binCount) {	// 5
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);		// 6
                    break;
                }
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;							// 7
                p = e;
            }
        }
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;					// 8
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    if (++size > threshold)
        resize();								// 9
    afterNodeInsertion(evict);
    return null;
}

判断table是否有初始化，如果没有初始化则进行初始化
判断 table对应的hash槽是否有元素，如果没有元素则将内容直接置为待put的元素
如果该hash槽已经有内容，则判断第一个节点的key是否是该key，是则将待修改的节点指向它
判断该hash槽的节点是否已经转为了红黑树，若是则执行红黑树的插入方法
在链表中若找不到相同的key，则插入到链表的末尾
插入到链表尾端后检查是否超过了7个节点，即大于等于8个，若超过了7个则树化
如果在链表中找到了相同的key则直接退出
对找到了key的节点进行更新，更新它的value
如果没有找到key，则说明执行了插入节点，因此会计算此时的size是否大于了扩容临界值决定是否扩容

resize() 源码解析

HashMap扩容的核心机制

jdk 1.7 版本：

// newCapacity为新的容量
void resize(int newCapacity) {
    // 小数组，临时过度下
    Entry[] oldTable = table;
    // 扩容前的容量
    int oldCapacity = oldTable.length;
    // MAXIMUM_CAPACITY 为最大容量，2 的 30 次方 = 1<<30
    if (oldCapacity == MAXIMUM_CAPACITY) {
        // 容量调整为 Integer 的最大值 0x7fffffff（十六进制）=2 的 31 次方-1
        threshold = Integer.MAX_VALUE;
        return;
    }

    // 初始化一个新的数组（大容量）
    Entry[] newTable = new Entry[newCapacity];
    // 把小数组的元素转移到大数组中
    transfer(newTable, initHashSeedAsNeeded(newCapacity));
    // 引用新的大数组
    table = newTable;
    // 重新计算阈值
    threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
}

void transfer(Entry[] newTable, boolean rehash) {
    // 新的容量
    int newCapacity = newTable.length;
    // 遍历小数组
    for (Entry<K,V> e : table) {
        while(null != e) {
            // 拉链法，相同 key 上的不同值
            Entry<K,V> next = e.next;
            // 是否需要重新计算 hash
            if (rehash) {
                e.hash = null == e.key ? 0 : hash(e.key);
            }
            // 根据大数组的容量，和键的 hash 计算元素在数组中的下标
            int i = indexFor(e.hash, newCapacity);

            // 同一位置上的新元素被放在链表的头部
            e.next = newTable[i];

            // 放在新的数组上
            newTable[i] = e;

            // 链表上的下一个元素
            e = next;
        }
    }
}

jdk 1.8 版本：

final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    if (oldCap > 0) {
        // 超过最大值就不再扩充了，就只好随你碰撞去吧
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        // 没超过最大值，就扩充为原来的2倍
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; // double threshold
    }
    else if (oldThr > 0) // initial capacity was placed in threshold
        newCap = oldThr;
    else {               // zero initial threshold signifies using defaults
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    // 计算新的resize上限
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;
    @SuppressWarnings({"rawtypes","unchecked"})
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab;
    if (oldTab != null) {
        // 小数组复制到大数组
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                else if (e instanceof TreeNode)
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else { // preserve order
                    // 链表优化重 hash 的代码块
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    do {
                        next = e.next;
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    // 原来的索引
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    // 索引+原来的容量
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

线程不安全原因解析

三个原因：

多线程下扩容可能会死循环
多线程下put可能会导致元素丢失
put和get并发时可能会导致get到null

1. 多线程下扩容可能会死循环

在jdk 7版本中出现的问题，由于在扩容时对链表使用的头插法，在多线程下可能会出现循环链表导致死循环。在jdk 8中修复了该问题。

2. 多线程下put可能会导致元素丢失

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        Node<K,V> e; K k;
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
            for (int binCount = 0; ; ++binCount) {
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}

问题出在这里：

if ((p = tab[i = (n - 1) & hash]) == null)
    tab[i] = newNode(hash, key, value, null);

如果A、B线程同时执行到此处，A在执行到 tab[i] = newNode(hash, key, value, null); 被挂起，B执行完毕后tab[i]已经存在内容，但A继续执行后就覆盖掉了B线程执行的内容，导致元素丢失。

3. put和get并发时可能会导致get到null

现在有线程A、B，A在执行put方法，且需要扩容，在执行resize方法时执行到了 table = newTab;语句，此时B线程执行get方法则会因为table没有内容而无法获取到真正的元素。

墨鱼的s我

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HashMap源码解读

在jdk 7版本中出现的问题，由于在扩容时对链表使用的头插法，在多线程下可能会出现循环链表导致死循环。在jdk 8中修复了该问题。被挂起，B执行完毕后tab[i]已经存在内容，但A继续执行后就覆盖掉了B线程执行的内容，导致元素丢失。现在有线程A、B，A在执行put方法，且需要扩容，在执行resize方法时执行到了。语句，此时B线程执行get方法则会因为table没有内容而无法获取到真正的元素。如果A、B线程同时执行到此处，A在执行到。HashMap扩容的核心机制。可以看到主要是调用了。
复制链接

扫一扫