2-2-3-9-2-1、jdk1.8HashMap详解

最新推荐文章于 2024-10-10 23:42:47 发布

析道者

最新推荐文章于 2024-10-10 23:42:47 发布

阅读量58

点赞数

分类专栏：进阶并发编程-JDK 文章标签： java 数据结构 HashMap 数组链表

本文链接：https://blog.csdn.net/weixin_41381248/article/details/128455470

版权

进阶同时被 2 个专栏收录

54 篇文章 0 订阅

订阅专栏

并发编程-JDK

20 篇文章 0 订阅

订阅专栏

数据结构

jdk1.8的hashmap的底层结构是数组+链表+红黑树实现的,将key的hash值进行取模获取index既即将存放的元素的数组的位置。然后到对应的链表或树中进行put和get操作

数据结构简图

在这里插入图片描述

源码分析

详细流程图如下：

在这里插入图片描述

重要成员变量

/**
 *默认的初始容量 - 必须是2的幂。
 *这里可以看出默认容量是16
 */
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
 /**
 * 最大容量，如果一个更高的值被隐含地指定，则使用该值。
 * 的任何一个构造函数所隐含的更高值。
 *必须是2的幂<=1<<30.
 */
static final int MAXIMUM_CAPACITY = 1 << 30;
/**
 * 当构造函数中没有指定时，使用的负载因子。
 */
static final float DEFAULT_LOAD_FACTOR = 0.75f;
 /**
 * 使用树形而非列表的bin计数阈值。
 * bin的阈值。 当添加一个元素到一个至少有这么多节点的bin时，bin会被转换为树。
 * 至少有这么多的节点时，Bin会被转换为树。这个值必须大于
 * 大于2，并且至少应该是8，以符合树形删除的假设。
 * 树的移除在缩减时转换为普通的Bins。
 * 缩减。
 */
static final int TREEIFY_THRESHOLD = 8;
/**
*就是当红黑树上的值只有6个时，这时转为链表结构
*/
static final int UNTREEIFY_THRESHOLD = 6;
/**
 *最小的表的容量，对于它来说，bin可以被树化。
 * （否则，如果一个bin中的节点太多，表就会被调整大小）。
 * 应该至少是4 * TREEIFY_THRESHOLD以避免冲突
 * 调整大小和树化阈值之间。
 */
static final int MIN_TREEIFY_CAPACITY = 64;
/**
 * 表，在第一次使用时被初始化，并根据需要调整大小。
 * 必要时调整。当分配时，长度总是2的幂。
 * (在某些操作中，我们也容忍长度为零，以允许
 * 目前不需要的引导机制）。
 */
transient Node<K,V>[] table;
 /**
 * 保存缓存的 entrySet()。请注意，AbstractMap字段被用于
 *用于keySet()和values()。
 */
transient Set<Map.Entry<K,V>> entrySet;
/**
 *该地图中包含的键值映射的数量。
 */
transient int size;
/**
 * 这个HashMap在结构上被修改的次数
 * 结构性修改是指改变HashMap中的映射数量或以其他方式修改其内部结构的修改。
 * HashMap或以其他方式修改其内部结构（例如。
 * 重新洗牌）。 这个字段被用来使HashMap的集合视图上的迭代器失效。
 * HashMap的迭代器快速失败。 (参见ConcurrentModificationException）。
 */
transient int modCount;
/**
* 下一个要调整的尺寸值（容量*负载系数）。扩容的阈值
*/
int threshold;
/**
* 加载因子
*/
final float loadFactor;

构造函数

/**
* 无参构造
*/
public HashMap() {
    //DEFAULT_LOAD_FACTOR=0.75
    //这里只是做了给加载因子赋值0.75
    this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
/**
* initialCapacity:初始化容量
* loadFactor:加载因子
*/
public HashMap(int initialCapacity, float loadFactor) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity: " +
                                           initialCapacity);
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " +
                                           loadFactor);
    this.loadFactor = loadFactor;
    //扩容的阈值
    this.threshold = tableSizeFor(initialCapacity);
}
/**
* 返回给定目标容量的2次方大小。
* 这一步其实就是找比传入容量大的最近的一个2的幂次方的值
*/
static final int tableSizeFor(int cap) {
    int n = cap - 1;
    n |= n >>> 1;
    n |= n >>> 2;
    n |= n >>> 4;
    n |= n >>> 8;
    n |= n >>> 16;
    return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}

节点对象

static class Node<K,V> implements Map.Entry<K,V> {
    //hash值
    final int hash;
    //key
    final K key;
    //calue
    V value;
    //下一个node节点
    Node<K,V> next;
    Node(int hash, K key, V value, Node<K,V> next) {
        this.hash = hash;
        this.key = key;
        this.value = value;
        this.next = next;
    }
        
    public final K getKey()        { return key; }
    public final V getValue()      { return value; }
    public final String toString() { return key + "=" + value; }
    
    public final int hashCode() {
        //异或运算，渐少hash碰撞
        return Objects.hashCode(key) ^ Objects.hashCode(value);
    }
    
    public final V setValue(V newValue) {
        V oldValue = value;
        value = newValue;
        return oldValue;
    }
     
    public final boolean equals(Object o) {
        if (o == this)
            return true;
        if (o instanceof Map.Entry) {
            Map.Entry<?,?> e = (Map.Entry<?,?>)o;
            if (Objects.equals(key, e.getKey()) &&
                Objects.equals(value, e.getValue()))
                return true;
        }
        return false;
    }
}

put操作

public V put(K key, V value) {
    //参数一:key的哈希值
    //参数二:key
    //参数三:value
    //参数四:onlyIfAbsent if true, don't change existing value
    //参数五:evict if false, the table is in creation mode.(创建模式)
    return putVal(hash(key), key, value, false, true);
}

putVal

/**
 * Implements Map.put and related methods
 *
 * @param hash hash for key
 * @param key the key
 * @param value the value to put
 * @param onlyIfAbsent if true, don't change existing value
 * @param evict if false, the table is in creation mode.
 * @return previous value, or null if none
 */
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    //表格           节点          表格长度 表索引
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    //如果在put时，表格还不存在，那么就开始初始化表格
    if ((tab = table) == null || (n = tab.length) == 0)
        //记录初始化表格的大小
        n = (tab = resize()).length;
    //如果表格存在就新建节点放在计算的tab[i]位置
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        //这里就是向链表或者红黑树中追加元素了
        Node<K,V> e; K k;
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            //key相同
            e = p;
        else if (p instanceof TreeNode)
            //放入红黑树
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
            //这里采用自旋操作
            for (int binCount = 0; ; ++binCount) {
                //这里是尾插法的体现
                if ((e = p.next) == null) {
                    //在尾部插入新的节点
                    p.next = newNode(hash, key, value, null);
                    //判断是否达到转换为红黑树的条件
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        //key存在就更新值操作
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            //返回旧值
            return oldValue;
        }
    }
    //修改次数增加
    ++modCount;
    //如果当前达到扩容的阈值就执行扩容操作
    if (++size > threshold)
        //扩容
        resize();
    afterNodeInsertion(evict);
    return null;
}

resize

/**
 * 初始化或加倍表的大小。 如果为空，则按照
 * 与字段阈值中持有的初始容量目标一致。
 * 否则，因为我们使用的是2次方扩展，所以
 * 每个bin的元素必须保持在相同的索引上，或者移动到
 * 在新表中以2的幂数偏移。
 *
 * @返回表
 */   
final Node<K,V>[] resize() {
    //旧表格
    Node<K,V>[] oldTab = table;
    //旧表格的容量
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    //旧的临界值
    int oldThr = threshold;
    //初始化新表格的大小和临界值
    int newCap, newThr = 0;
    //如果旧数组的容量大于0，说明旧数组是存在的
    if (oldCap > 0) {
        //如果大于了最大容量值直接返回旧数组就行，没法扩容了
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        //这里是扩容操作，新数组是原来数组的两倍
        //临界值也是原来临界值的两倍
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; // double threshold
    }
    //如果旧数组的容量为0，而临界值存在，就将该临界值作为新数组的容量
    else if (oldThr > 0) // initial capacity was placed in threshold
        newCap = oldThr;
    else {               // zero initial threshold signifies using defaults
        //初始化新数组的容量为默认容量16
        newCap = DEFAULT_INITIAL_CAPACITY;
        //新数组的临界值为16*0.75=12
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    //确保初始化的数组的相关参数必须有值
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;
    //新建一个table数组，大小是newCap
    @SuppressWarnings({"rawtypes","unchecked"})
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    //赋值给全局的table变量
    table = newTab;
    //如果是扩容操作，我们需要把旧数组的数据移动到新数组中去
    if (oldTab != null) {
        //遍历旧数组的每一个桶的位置，因为可能是链表或者红黑树的结构，所以需要循环遍历 
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                //这一步就是释放旧数组J位置的空间
                oldTab[j] = null;
                //单节点的操作
                if (e.next == null)
                    //重新计算哈希值，将e元素放在新数组中
                    newTab[e.hash & (newCap - 1)] = e;
                else if (e instanceof TreeNode)
                    //红黑树的操作
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else { // preserve order
                    //如果不是单节点也不是红黑树，也就是链表的时候，这时移动到新数组的
                    //低位头尾节点
                    Node<K,V> loHead = null, loTail = null;
                    //高位头尾节点
                    Node<K,V> hiHead = null, hiTail = null;
                    //下一个节点
                    Node<K,V> next;
                    do {
                        next = e.next;
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

重点移位操作

if ((e.hash & oldCap) == 0) {
    if (loTail == null)
        loHead = e;
    else
        loTail.next = e;
    loTail = e;
}
else {
    if (hiTail == null)
        hiHead = e;
    else
        hiTail.next = e;
    hiTail = e;
}

假设迁移之前的数据结构为：

在这里插入图片描述

迁移中则为：

在这里插入图片描述

迁移后为：

在这里插入图片描述

总结

初始化表格是在第一次用到的时候，也就是put值的时候table才会被初始化，这样做有利于减少空间资源的浪费
扩容机制的触发是在put元素时发现当前table的中存储的元素达到了临界值，就开始扩容操作，初始化和扩容全部是在resize()方法中实现的
树化的阈值是8，而链表化的阈值是6，是因为两者之间如果频繁转换很影响性能，所以当红黑树移除一个元素时不会立即就触发转为链表的操作，提高性能和效率
hashmap1.8旧数组中的元素移到新数组时，低位的仍然保留在原来索引的位置，而高位的索引则是原来索引值+oldCap

get操作

 public V get(Object key) {
    Node<K,V> e;
    return (e = getNode(hash(key), key)) == null ? null : e.value;
}
final Node<K,V> getNode(int hash, Object key) {
    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
        //从链表的首节点开始查询，如果key相同就返回
        if (first.hash == hash && // always check first node
            ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        if ((e = first.next) != null) {
            //遍历红黑树
            if (first instanceof TreeNode)
                return ((TreeNode<K,V>)first).getTreeNode(hash, key);
            do {
                //遍历链表
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    //如果找不到返回null
    return null;
}

线程不安全的点

在putVal方法中，着重下面代码：

 if ((p = tab[i = (n - 1) & hash]) == null){
     //如果没有hash碰撞则直接插入元素
     tab[i] = newNode(hash, key, value, null);
 }

经过以下两步，则会出现线程不安全问题

这是jdk1.8中HashMap中put操作的主函数，注意如果没有hash碰撞则会直接插入元素。如果线程A和线程B同时进行put操作，刚好这两条不同的数据hash值一样，并且该位置数据为null，所以这线程A、B都会进入第3行代码中
假设一种情况，线程A进入后还未进行数据插入时挂起，而线程B正常执行，从而正常插入数据，然后线程A获取CPU时间片，此时线程A不用再进行hash判断了，问题出现：线程A会把线程B插入的数据给覆盖，发生线程不安全