HashMap底层实现原理

最新推荐文章于 2024-08-28 17:35:17 发布

随心所向李先生

最新推荐文章于 2024-08-28 17:35:17 发布

阅读量221

点赞数 4

分类专栏： HashMap集合原理文章标签： hashmap 集合数据结构链表

本文链接：https://blog.csdn.net/a032788a/article/details/115697485

版权

HashMap集合原理专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文详细介绍了HashMap的底层实现，包括初始容量、最大容量、加载因子等参数，以及put方法的源码分析。重点讨论了HashMap的扩容机制，首次扩容发生在添加第一个元素时，扩容策略为容量翻倍。当链表长度超过8且数组大小超过64时，链表会转换为红黑树以提高查找效率。此外，文章还提及了1.8版本中尾部插入以避免并发问题。

摘要由CSDN通过智能技术生成

HashMap底层实现原理

最近有时间看了下HashMap的源码，收获还是蛮多的，正好好多朋友面试问的也比较多，就给大家来分享一下，顺便自己加深下印象。
首先来看下它里面主要参数

  //初始容量
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
   //最大容量
    static final int MAXIMUM_CAPACITY = 1 << 30;
    //默认因子
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

    //树化阈值
    static final int TREEIFY_THRESHOLD = 8;

    //树退化阈值
    static final int UNTREEIFY_THRESHOLD = 6;

    //最小树形化
    static final int MIN_TREEIFY_CAPACITY = 64;
    //存放元素的数组
  transient Node<K,V>[] table;


    transient Set<Map.Entry<K,V>> entrySet;


    transient int size;


    transient int modCount;

    //阀值  也就是 允许的最大元素数目
    int threshold;

   //加载因子
    final float loadFactor;
还有一个内部类Node 用来装 元素 也就是 key value 和hash

  static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        V value;
        //这个next就是链表中的下一个元素
        Node<K,V> next;

}

一般我们用Hashmap初始化的时候都是这样
Map<?,?> map=new Hashmap<>();
或者带参数的
Map<?,?> map=new Hashmap<>(100);
等

这时会走下边的初始化方法

   //初始化 二次幂获取阀值
    static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }
 //构造方法 初始化容量和加载因子
    public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                    initialCapacity);
        //如果大于最大容量就把最大容量赋值给当前参数
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                    loadFactor);
        this.loadFactor = loadFactor;
        //初始化阀值
        this.threshold = tableSizeFor(initialCapacity);
    }

    public HashMap(int initialCapacity) {
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }


    public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }

从这里我们可以看到如果在初始化的时候，那么只给加载因子这个变量赋值，还有初始化容量这个变量赋值，没有扩容这会容量还是0，那么什么时候第一次扩容呢，
第一次添加元素的时候
下边来看下put方法的源代码


//根据k 算出k的hash值
    static final int hash(Object key) {
        int h;
      /*
         key.hashCode()) ^ (h >>> 16 使得hash值更加随机
       */
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }


 //1添加数据入口方法
    public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }


    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        //这里先判断下table是否为空或者长度是否为0，如果是那么初始化table容量,也就是第一次扩容。
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        //(n - 1) & hash算出当前元素存放的位置i  进一步判断当前位置是否存在元素
        if ((p = tab[i = (n - 1) & hash]) == null)
            //如果不存在就把当前元素放到这里
            tab[i] = newNode(hash, key, value, null);
        else {
        //定义一个临时节点 Node<K,V> e
            Node<K,V> e; K k;
            //如果当前位置存在元素且元素的k和将要存放元素的k一样 就把原来的元素存放在e里面
            if (p.hash == hash &&
                    ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
                //如果当前位置存放的元素是红黑树，那么直接把元素放在红黑树节点上
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
                //链表操作
            else {
            //遍历循环链表节点
                for (int binCount = 0; ; ++binCount) {
                //找到链表的尾部然后插入进去
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        //如果链表的数量大于等于树化阈值（默认是8）就走红黑树方法，然后返回
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    //如果链表中有元素和将要添加的元素相同的时候 跳出循环
                    if (e.hash == hash &&
                            ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            //把将要添加元素的value值替换掉原来的
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        //判断元素的个数如果大于允许的最大元素数目threshold=容量*加载因子就扩容
        
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

这就是整个put操作步骤，可以看到1.8里面的的链表是尾部插入的，这点和1.7正好想反，并且是先添加后扩容的。接下来我们来看下里面用到的
treeifyBin(tab, hash) 红黑树方法

 final void treeifyBin(Node<K,V>[] tab, int hash) {
        int n, index; Node<K,V> e;
        //先判断tab长度是否大于64，如果不是则扩容
        if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
            resize();
        else if ((e = tab[index = (n - 1) & hash]) != null) {
            TreeNode<K,V> hd = null, tl = null;
            do {
                TreeNode<K,V> p = replacementTreeNode(e, null);
                if (tl == null)
                    hd = p;
                else {
                    p.prev = tl;
                    tl.next = p;
                }
                tl = p;
            } while ((e = e.next) != null);
            if ((tab[index] = hd) != null)
                hd.treeify(tab);
        }
    }

可以看到里面有个判断，必须数组大于64。
所以转化红黑树的必要条件是链表大于等于8，数组大于64
接下来再来看下resize（）扩容方法

  final Node<K,V>[] resize() {
        //把table的元素赋值到oldTab 里
        Node<K,V>[] oldTab = table;
        int oldCap = (oldTab == null) ? 0 : oldTab.length;
        int oldThr = threshold;
        int newCap, newThr = 0;
        //如果当前容量不为空
        if (oldCap > 0) {
        //如果大于最大容量
            if (oldCap >= MAXIMUM_CAPACITY) {
            //设置允许存放元素的个数为int的最大值
                threshold = Integer.MAX_VALUE;
                return oldTab;
            }
            //如果在最大容量范围内 把原来的容量向左位移1 就相当于扩大两倍
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                    oldCap >= DEFAULT_INITIAL_CAPACITY)
                    //阀值也扩大两倍
                newThr = oldThr << 1; // double threshold
        }
        //如果当前容量为空且oldThr 大于0说明第一次添加且初始化hashmap的时候把阀值oldThr 初始化了 
        
        else if (oldThr > 0) // initial capacity was placed in threshold
            newCap = oldThr;
            //容量为空第一次添加元素 阀值 没有被初始化
        else {               // zero initial threshold signifies using defaults
        //给容量赋值
            newCap = DEFAULT_INITIAL_CAPACITY;
            //阀值赋值
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
        }
        if (newThr == 0) {
            float ft = (float)newCap * loadFactor;
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                    (int)ft : Integer.MAX_VALUE);
        }
        threshold = newThr;
        @SuppressWarnings({"rawtypes","unchecked"})
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        table = newTab;
        if (oldTab != null) {
            for (int j = 0; j < oldCap; ++j) {
                Node<K,V> e;
                if ((e = oldTab[j]) != null) {
                    oldTab[j] = null;
                    if (e.next == null)
                        newTab[e.hash & (newCap - 1)] = e;
                    else if (e instanceof TreeNode)
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    else { // preserve order
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        do {
                            next = e.next;
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }
                            else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        if (loTail != null) {
                            loTail.next = null;
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        return newTab;
    }

这就是整个扩容操作
总结一下
1、链表尾部插入因为头部插入法，在扩容时会改变链表中元素原本的顺序，以至于在并发场景下导致链表成环的问题。而在jdk1.8中采用尾插入法，在扩容时会保持链表元素原本的顺序，就不会出现链表成环的问题了
2、链表大于8 数组大于64会改成红黑树存储
3、第一次扩容在第一次添加的时候
4、先添加元素在判断是否扩容
5、k的hash算法 (h = key.hashCode()) ^ (h >>> 16）
欢迎大家一起讨论一起学习

随心所向李先生

关注

4
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
HashMap底层实现原理

HashMap底层实现原理最近有时间看了下HashMap的源码，收获还是蛮多的，正好好多朋友面试问的也比较多，就给大家来分享一下，顺便自己加深下印象。首先来看下它里面主要参数 //初始容量 static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16 //最大容量 static final int MAXIMUM_CAPACITY = 1 << 30; //默认因子 stati
复制链接

扫一扫

专栏目录