Java从入门到放弃（十一）集合框架之HashMap源码(2)

最新推荐文章于 2024-09-20 15:32:13 发布

鱼机

最新推荐文章于 2024-09-20 15:32:13 发布

阅读量176

点赞数 2

分类专栏： java从入门到放弃文章标签： java

本文链接：https://blog.csdn.net/qq_34101608/article/details/80160003

版权

java从入门到放弃专栏收录该内容

17 篇文章 0 订阅

订阅专栏

1、put方法

 public V put(K key, V value) {
            return putVal(hash(key), key, value, false, true);
       }
	//hash就是key的hash值，根据这个hash得出数据存放再数组中的位置，onlyIfAbsent为true时，不存在key才会执行put操作。
       final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {
            Node<K,V>[] tab; Node<K,V> p; int n, i;
            if ((tab = table) == null || (n = tab.length) == 0)   // 初始化是一个空的Node数组
                n = (tab = resize()).length;   // 扩容方法，初始化扩容默认容量为16
            if ((p = tab[i = (n - 1) & hash]) == null)  //如果数组索引处为null
                tab[i] = newNode(hash, key, value, null);    //就把key-value构造一个Node数组插入数组中
            else {
                Node<K,V> e; K k;
                if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))  //如果hash和key都相等
                    e = p;
                else if (p instanceof TreeNode)   //如果是红黑树结构
                    e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
                else {
                    for (int binCount = 0; ; ++binCount) {
                        if ((e = p.next) == null) {
                            p.next = newNode(hash, key, value, null);   // 把新的Node节点插入链表的尾部(尾插法，1.8之前是头插入)
                            if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st   //如果链表长度大于等于8，转换为红黑树
                                treeifyBin(tab, hash);
                            break;
                        }
                        if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))  //已经插入完成，直接退出循环
                            break;
                        p = e;
                    }
                }
                if (e != null) { // existing mapping for key，如果存在对应的key值，直接进行更新操作
                    V oldValue = e.value;
                    if (!onlyIfAbsent || oldValue == null)    // onlyIfAbsent为false,就更新
                        e.value = value;
                    afterNodeAccess(e);
                    return oldValue;  //返回旧值
                }
            }
            ++modCount;         //修改记录值
            if (++size > threshold)   //size大于负载因子要求的容量值就进行扩容
                resize();
            afterNodeInsertion(evict);
            return null;
    }

put方法如上所示，如果是一个初始化空的集合，put第一个键值对时，就会对Node数组初始化赋值，默认的容量16，有一个onlyIfAsent的参数，为true时，如果集合存在对应的Key值，不进行更新操作，如果为false，就更新对应key的value值。

插入键值对时，如果数组中对应hash的位置存在数据，要判断是红黑树结构还是链表结构，如果是红黑树结构，就把Node节点加入树中，并调整树节点。如果是链表结构，直接加入链表的尾部。当链表长度大于等于8时，要转换为红黑树结构。插入数据后对集合数据的size进行判断，大于负载因子*总容量时要进行扩容操作。

第9行中：p = tab[i = (n - 1) & hash]中，(n-1)&hash就是计算键值对在Node数组中的位置。只有hash的后几位数值起到了作用，具体可参考Java从入门到放弃（十）集合框架之HashMap源码(1)

1.8之前是头插入法，即插入的Node节点是在链表的头部，这是因为考虑到LRU，即最新插入的数据最有可能倍用到，1.8以后改为了尾插入，据说是为了更好的resize操作，因为1.7的扩容计算更多而且多线程下有可能会出现死循环的问题。

2、hash方法

static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

hash方法是HashMap中用于计算键值对在Node数组中位置的重要方法。这里是一个很简单也很巧妙的计算，如果key是null值，直接返回0，由此可以看出key为null的键值对存储在Node的0位置上。计算是直接把hash的高16位和低16位进行异或运算(int总共32位）。其实这个算法最主要是使得数据尽可能的均匀分布，所以要减少碰撞。因为异或运算中，一个数异或0都得出自身，所以能尽量减少hashcode方法返回不同的值但是在用(n-1)&hash计算得出同样的结果的情况。上面是1.8以后的hash方法，1.7的hash方法如下，

    final int More ...hash(Object k) {
         int h = hashSeed;
         if (0 != h && k instanceof String) {
             return sun.misc.Hashing.stringHash32((String) k);
         }
         h ^= k.hashCode();
 
         h ^= (h >>> 20) ^ (h >>> 12);
         return h ^ (h >>> 7) ^ (h >>> 4);
     }

求出hashcode后，进行了很多次右移和异或运算，具体可以自己去画出对应的二进制运算图，其实就是尽量的让每一位数值都参与到运算中，这样子就能减少hash碰撞的发生。

3、扩容resize

final Node<K,V>[] resize() {
        Node<K,V>[] oldTab = table;   //旧的Node数组
        int oldCap = (oldTab == null) ? 0 : oldTab.length;    //旧的容量
        int oldThr = threshold;                               //旧的最大的size值
        int newCap, newThr = 0;
        if (oldCap > 0) {
            if (oldCap >= MAXIMUM_CAPACITY) {               //如果大于等于最大容量值就无法进行扩容
                threshold = Integer.MAX_VALUE;
                return oldTab;
            }
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&oldCap >= DEFAULT_INITIAL_CAPACITY)    //扩容是使容量加倍
                newThr = oldThr << 1; // double threshold
        }
        else if (oldThr > 0) // initial capacity was placed in threshold   //初始化的空的数组
            newCap = oldThr;
        else {               // zero initial threshold signifies using defaults
            newCap = DEFAULT_INITIAL_CAPACITY;             //初始化一些默认的参数
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
        }
        if (newThr == 0) {
            float ft = (float)newCap * loadFactor;      //计算新的最大size值
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
        }
        threshold = newThr;
        @SuppressWarnings({"rawtypes","unchecked"})
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        table = newTab;
        if (oldTab != null) {
            for (int j = 0; j < oldCap; ++j) {
                Node<K,V> e;
                if ((e = oldTab[j]) != null) {
                    oldTab[j] = null;
                    if (e.next == null)
                        newTab[e.hash & (newCap - 1)] = e;   //如果该位置只有一个Node节点，重新计算位置插入
                    else if (e instanceof TreeNode)
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);    //红黑树重新构建
                    else { // preserve order
                        Node<K,V> loHead = null, loTail = null;       //loHead是头节点，loTail是现在的节点， 
                        Node<K,V> hiHead = null, hiTail = null;         
                        Node<K,V> next;
                        do {
                            next = e.next;       //把原链表元素遍历
                            if ((e.hash & oldCap) == 0) {    //如果计算为0，就存入loHead为头节点的链表中      
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }
                            else {                            //存入以hiHead为头节点的链表中
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;      //loHead链表直接插入新数组的j位置
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;     //hiHead链表直接插入新数组的j+oldCap位置
                        }
                    }
                }
            }
        }
        return newTab;
    }

扩容操作：如果是新的初始化的集合，就设置一些默认的参数为容量。否则就把容量扩大为原来的2倍，重新生成一个2*oldCap的数组，然后对oldTable的Node数组进行循环遍历重新插入新的数组，如果只有一个元素，直接重新计算位置执行插入。如果是红黑树，执行对应的函数，这里不做研究。如果是链表结构，因为数组的位置是hash&(cap-1)计算出来的，如cap是变成2*cap，对应二进制来说就是(cap-1)就是多了一个1，例如：oldcap是2^6，二进制oldcap-1就是111111，那么新的（2*oldcap-1)就是1111111，hash&(newcap-1）开头就要多一位0或者1，如果是0，结果就是一样的。在数组中所有是不变的，如果是1，就是相当于多加了一个oldCap的值，所以链表中的Node节点，要么在j索引(原先的位置)处，要么在j+oldCap处

在1.7以及之前是直接对每一个Node节点进行重新计算插入的，更耗性能。

4、get方法

    public V get(Object key) {
        Node<K,V> e;
        return (e = getNode(hash(key), key)) == null ? null : e.value;   //没有对应返回null,有就返回value值
    }

final Node<K,V> getNode(int hash, Object key) {
        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
        if ((tab = table) != null && (n = tab.length) > 0 &&(first = tab[(n - 1) & hash]) != null) {  //如果对应hash的位置有数据
            if (first.hash == hash &&     // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))   //如果first节点的key和查询的key相等，直接返回first节点
                return first;
            if ((e = first.next) != null) {
                if (first instanceof TreeNode)             //红黑树结构
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))           //遍历链表，查询到对应的key的Node节点
                        return e;
                } while ((e = e.next) != null);
            }
        }
        return null;
    }

get方法比较简单一点，就是根据key值的hash值在Node数组中查找对应的位置，在对应位置中的节点、红黑树或者链表中知道对应的key值的Node的节点。找到就返回对应的value值，没有就直接返回null。