(一)HashMap源码浅谈:HashMap第一次put元素都干了些什么

最新推荐文章于 2022-10-23 11:08:28 发布

木)木

最新推荐文章于 2022-10-23 11:08:28 发布

阅读量1.1k

点赞数 1

分类专栏： Java 文章标签：源码

本文链接：https://blog.csdn.net/qq_40451749/article/details/87982733

版权

Java 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

文章目录

先说明一点,jdk8的HashMap源码把初始化放在了第一次添加元素的方法上,所以当我们构造无参容器实例的时候,是没有初始容量这一码事的.
今天比较无趣,渐渐迷失在了业务逻辑的海洋当中,而真正原始的技艺正在被渐渐遗忘掉.慢慢捡起来,从今天开始.开始慢慢接触源码性质的东西.本人也是菜鸟一枚,欢迎指点…
而且分析的不够全面… 仅仅只是第一次执行这个put方法会执行的流程而已

构造方法

在这里插入图片描述
一共四个构造方法.暂时只看第一个无参构造.

    /**
     * Constructs an empty <tt>HashMap</tt> with the default initial capacity
     * (16) and the default load factor (0.75).
     */
    public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }

可以看到,这个无参构造仅仅只是给加载因子赋值了.至于这个loadFactor是什么.emmm就是HashMap扩容的一个临界点的条件.HashMap这个集合需要这个临界点,对是否扩容进行判断.

    /**
     * The load factor for the hash table.
     *
     * @serial
     */
    final float loadFactor;
    /**
     * The load factor used when none specified in constructor.
     */
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

第一次添加元素.map.put(K,V);

    /**
     * Associates the specified value with the specified key in this map.
     * If the map previously contained a mapping for the key, the old
     * value is replaced.
     *
     * @param key key with which the specified value is to be associated
     * @param value value to be associated with the specified key
     * @return the previous value associated with <tt>key</tt>, or
     *         <tt>null</tt> if there was no mapping for <tt>key</tt>.
     *         (A <tt>null</tt> return can also indicate that the map
     *         previously associated <tt>null</tt> with <tt>key</tt>.)
     */
    public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }

非常简洁的一行代码.真正的实现是putVal方法.而且还可以看到.put之后,是有返回值的.这个返回值还是有点学问的.

putVal()方法

说这个方法方法之前,先介绍一个静态内部类.它实现了Map.Entry接口.这是一个内部接口…我第一次见.这个类就是Node<K,V>

    /**
     * Basic hash bin node, used for most entries.  (See below for
     * TreeNode subclass, and in LinkedHashMap for its Entry subclass.)
     */
    static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        V value;
        Node<K,V> next;

        Node(int hash, K key, V value, Node<K,V> next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }

        public final K getKey()        { return key; }
        public final V getValue()      { return value; }
        public final String toString() { return key + "=" + value; }

        public final int hashCode() {
            return Objects.hashCode(key) ^ Objects.hashCode(value);
        }

        public final V setValue(V newValue) {
            V oldValue = value;
            value = newValue;
            return oldValue;
        }

        public final boolean equals(Object o) {
            if (o == this)
                return true;
            if (o instanceof Map.Entry) {
                Map.Entry<?,?> e = (Map.Entry<?,?>)o;
                if (Objects.equals(key, e.getKey()) &&
                    Objects.equals(value, e.getValue()))
                    return true;
            }
            return false;
        }
    }

很明显的,这个类就是我们的节点类.这个类就是真正存放我们的map值的一个结构.
可以看到属性中,存放了final的hash值,final的k值.和value…在加上一个next属性.这个属性就是一种属于链式的结构了.下一个节点是什么.因为我们知道.当节点从数组上超过8个后,会变形成为红黑树,一种自平衡的二叉树.这个后边说吧…我也不是很懂.

   /**
     * Implements Map.put and related methods
     *
     * @param hash hash for key
     * @param key the key
     * @param value the value to put
     * @param onlyIfAbsent if true, don't change existing value
     * @param evict if false, the table is in creation mode.
     * @return previous value, or null if none
     */
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        // 创建了两个Node,tab和p默认值是null;还定义了两个int型....(这不是废话吗...)n是容器数组容器的长度
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        /**
          *这个地方多说几句.table据说是个桶.实际上是一个Node的数组
          *	transient Node<K,V>[] table;这是一个临时变量,改天有时间再研究transient修饰的什么意思.
          *	这里的这个是使用了一个临时的tab代替table.因为变量在创建对象的时候会被自动初始化.所以这个table是个null.这个涉及到类加载机制里面的一点问题.有时间研究一下.其实是研究过的.回头我在搞一下,然后贴一篇博客出来...本人菜鸟...意见仅供参考QAQ
          *	回归真题.第一次调用这个方法,肯定是null的.鉴于||是优化后的,所以,后半部分是不会执行的.
          */
        if ((tab = table) == null || (n = tab.length) == 0)
        	/*
        	 * 这里给n重新赋值了.很明显的n代表的是容器的长度,这里面的resize()方法.研究一下.放到下面了.那先去看一下resize方法
        	 * -----看完了,在下面-----
        	 * resize返回一个16长度大小的新的Node.
        	 */
            n = (tab = resize()).length;	//16
        if ((p = tab[i = (n - 1) & hash]) == null)	// 在这里是个定位.如果用原来要添加的元素,定位出来是一个空的位置.则直接将这个节点放到这个位置.
            tab[i] = newNode(hash, key, value, null);
            //否则...以后再说.
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;// 这个干啥的?布吉岛.据说是个快速报错机制.他是一个成员变量,也记录了HashMap经过结构修改的次数.
        if (++size > threshold)	// 如果长度大于了扩容点.那就进行扩容.也就是说我们要天剑第13个元素的时候会进行第二次扩容.
            resize();
        afterNodeInsertion(evict); // 这个方法...不解.因为是一个空方法,注释说是回调LinkedHashMap的后续操作.
        return null;	// return null.结束了..不对啊.那第一次添加元素,不就是返回null吗?.这个应该也是一个机制.后面再说.
    }

讲真.我看到这部分代码是有点小小的崩溃的.不过,看源码本来就是锻炼内心的.所以还是要坚持看下去的.磨练自己的内心.
可以看到是一个final修饰的方法不可以被继承,返回值是我们的value.
有五个参数.第一个是通过我们的key计算出来的hash值.这个计算方法还是比较复杂的.不在说了.改天有时间单独拿出来一部分时间去研究一下这个hashCode()方法.
第二个是key.第三个是value
第四个是一个条件如果是true,则不要更改现有的值,否则需要更改,上边添加的时候传递的是一个false所以我们需要更改现有的值,至于这个现有的值是什么,那只能往下看了
第五个.如果是false.则表处于创建模式.什么是创建模式.布吉岛啊…尴尬了,上边传递的是true.那就不是创建模式
参数弄完了.注释什么的.直接写在代码里面了.这样比较直观一些.看完这些可以回上边代码里面看一下

resize()方法的部分解释…

    /**
     * Initializes or doubles table size.  If null, allocates in
     * accord with initial capacity target held in field threshold.
     * Otherwise, because we are using power-of-two expansion, the
     * elements from each bin must either stay at same index, or move
     * with a power of two offset in the new table.
     *
     * @return the table
     */
    final Node<K,V>[] resize() {
    	// 顾名思义就是改变容器的大小,将原先的容器.存在oldTab
        Node<K,V>[] oldTab = table;
        // 得到原始容器的大小
        int oldCap = (oldTab == null) ? 0 : oldTab.length;
        // 这个threashoud是扩容点.简言之就是达到这个点的容器进行扩容.
        // int threshold;  一个成员变量,第一次并没有赋值,所以初始化为0
        int oldThr = threshold;
        // 这个newCap新容器的大小.newThr 是新的扩容点.
        int newCap, newThr = 0;
        /*
         * 如果oldCap>0.就是容器中存在元素.很明显我们的第一次扩容是不存在>0这种情况的.但是依然不妨碍我们分析一波.
         * 假设原来的容器大于0,如果原来的容器长度>=设定好的最大容器长度
         */
        if (oldCap > 0) {
            if (oldCap >= MAXIMUM_CAPACITY) {
            	// 将扩容点设置为最大值,意思就是我也不知道QAQ....
                threshold = Integer.MAX_VALUE;
                return oldTab;	// 返回老数组.
            }
            /*
             * 将oldCap左移1位赋值给newCap.如果newCap小于最大容器容量,并且oldCap大于等于默认初始容器容量
             * 就让老的扩容点左移1位,赋值给新的扩容点
             */
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)
                newThr = oldThr << 1; // double threshold
        }
        // 老扩容点大于0,就把老扩容点给新容器大小.
        else if (oldThr > 0) // initial capacity was placed in threshold
            newCap = oldThr;
        // 这个才是我们的第一次.正儿八经的第一次.将初始容器大小16给newCap.
        // 新的扩容点为加载因子乘以默认容器大小.
        else {               // zero initial threshold signifies using defaults
            newCap = DEFAULT_INITIAL_CAPACITY;	// 16
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);	// 12
        }
        // 如果newThr 为0.好吧..看不懂..哈哈.先过.第一次执行这个方法,也不走这里,淡定.
        if (newThr == 0) {
            float ft = (float)newCap * loadFactor;
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
        }
        // 将新扩容点赋值给成员变量threshold.这个是正儿八经的扩容点
        threshold = newThr;
        @SuppressWarnings({"rawtypes","unchecked"})
            Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];	// 新建一个新的容器
        table = newTab;	 // 将这新的容器赋值给table.正儿八经的容器.前边的都是临时的.
        // 这里面才也能知道是干啥的了.就是将旧容器的内容添加到新的容器里面.
        // 下面if里面的先过了.因为.oldtab确实为null
        if (oldTab != null) {
        // 一波遍历旧容器
            for (int j = 0; j < oldCap; ++j) {
                Node<K,V> e;
                // 判断去取出来的元素是不是null
                if ((e = oldTab[j]) != null) {
                	// 将老容器改节点置null
                    oldTab[j] = null;
                    // 因为Map是后挂式的.所以要判断是不是有下一个节点.
                    // 如果没有下一个节点.
                    if (e.next == null)
                    	// 将这个元素重新计算一下位置.这个定位原理就是用hash值 & 容器大小减1.至于为什么这样写.那是因为这样能产生一个很均衡的散列.落点都是非常均匀的.至于这个与原理...下一篇单独列出来.HashMap的数组位置,元素的落点就是根据这个计算弄出来的.
                        newTab[e.hash & (newCap - 1)] = e;
                        // 瞅瞅这个treenode...他是一个树节点.这个内部类大概是600行.我就不粘提了.....
                        // 如果这个实例是TreeNode的
                    else if (e instanceof TreeNode)
                    	// 调用方法进行拆分.拆分个锤子啊....拆..个锤子.有时间再拆
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    else { // preserve order
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        do {
                            next = e.next;
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }
                            else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        // 返回新的容器
        return newTab;
    }

突然想用英文写博客了…可惜我英文不好…哈哈.
看方法注释,初始化或者加倍表格的大小.至于为什么是加倍.这个里面有一个叫定位原理的东西.反正意思就是容器的大小一定要是2的n次幂大小.后边在解释.然后如果为null,就初始化为16.就是上边的初始容量.拿过来瞅一眼.

    /**
     * The default initial capacity - MUST be a power of two.
     * 这里有解释,必须是2的指数大小.用的位移...挺牛逼的.
     */
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

好了接着回到resize()方法.