HashMap源码解析包含1.7和1.8版本

HashMap底层解析(包含1.7)

在这里插入图片描述
链表的每个节点就是一个Entry,其中包括:键key、值value、键的哈希码hash、执行下一个节点的引用next四部分

static class Entry<K, V> implements Map.Entry<K, V> {
    final K key; //key
    V value;//value
    Entry<K, V> next; //指向下一个节点的指针
    int hash;//哈希码
}

内部成员变量含义

JDK1.7中HashMap的主要成员变量及其含义

public class HashMap<K, V> implements Map<K, V> {
//哈希表主数组的默认长度
    static final int DEFAULT_INITIAL_CAPACITY = 16; 
//默认的装填因子
    static final float DEFAULT_LOAD_FACTOR = 0.75f; 
//主数组的引用!!!!
    transient Entry<K, V>[] table; 
    int threshold;//界限值  阈值
    final float loadFactor;//装填因子
    public HashMap() {
        this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
    }
}

put()方法

调用put方法添加键值对。哈希表三步添加数据原理的具体实现;是计算key的哈希码,和value无关。特别注意:

  1. 第一步计算哈希码时,不仅调用了key的hashCode(),还进行了更复杂处理,目的是尽量保证不同的key尽量得到不同的哈希码

  2. 第二步根据哈希码计算存储位置时,使用了位运算提高效率。同时也要求主数组长度必须是2的幂)

  3. 第三步添加Entry时添加到链表的第一个位置,而不是链表末尾

  4. 第三步添加Entry是发现了相同的key已经存在,就使用新的value替代旧的value,并且返回旧的value

public class HashMap {
    public V put(K key, V value) {
       //如果key是null,特殊处理
        if (key == null) return putForNullKey(value);
        //1.计算key的哈希码hash 
        int hash = hash(key);
        //2.将哈希码代入函数,计算出存储位置  y= x%16;
        int i = indexFor(hash, table.length);
        //如果已经存在链表,判断是否存在该key,需要用到equals()
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            //如找到了,使用新value覆盖旧的value,返回旧value
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { 
                V oldValue = e.value;// the United States
                e.value = value;//America
                e.recordAccess(this);
                return oldValue;
            }
        }
        //添加一个结点
        addEntry(hash, key, value, i);
        return null;
    }
final int hash(Object k) {
    int h = 0;
    h ^= k.hashCode();
    h ^= (h >>> 20) ^ (h >>> 12);
    return h ^ (h >>> 7) ^ (h >>> 4);
}
static int indexFor(int h, int length) {
//作用就相当于y = x%16,采用了位运算,效率更高
    return h & (length-1);
 }
}

标addEntry()方法

添加元素时如达到了阈值,需扩容,每次扩容为原来主数组容量的2倍

void addEntry(int hash, K key, V value, int bucketIndex) {
    //如果达到了门槛值,就扩容,容量为原来容量的2倍 16---32
    if ((size >= threshold) && (null != table[bucketIndex])) {
        resize(2 * table.length);
        hash = (null != key) ? hash(key) : 0;
        bucketIndex = indexFor(hash, table.length);
    }
    //添加节点
    createEntry(hash, key, value, bucketIndex);
}

get()方法

public V get(Object key) {
    //根据key找到Entry(Entry中有key和value)
    Entry<K,V> entry = getEntry(key);
    //如果entry== null,返回null,否则返回value
    return null == entry ? null : entry.getValue();
}

HashMap1.8源码分析

在这里插入图片描述

基本属性

public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable {
  //序列化和反序列化时使用相同的id
  private static final long serialVersionUID = 362498820763181265L;
  //初始化容量
  static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
  //最大容量
  static final int MAXIMUM_CAPACITY = 1 << 30;
  //默认负载因子
  static final float DEFAULT_LOAD_FACTOR = 0.75f;
  //树形阈值
  static final int TREEIFY_THRESHOLD = 8;
  //取消阈值
  static final int UNTREEIFY_THRESHOLD = 6;
  //最小树形容量
  static final int MIN_TREEIFY_CAPACITY = 64;
  //节点
  transient Node<K,V>[] table;
  //存储键值对的个数
  transient int size;
  //散列表被修改的次数
  transient int modCount; 
  //扩容临界值
  int threshold;
  //负载因子
  final float loadFactor;
}

构造方法

//和1.7区别不大
//无参构造器,加载因子默认为0.75
public HashMap() {
    this.loadFactor = DEFAULT_LOAD_FACTOR;
}
//指定容量大小的构造器,但调用了双参的构造器,加载因子0.75
public HashMap(int initialCapacity) {
    this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
//全参构造器
public HashMap(int initialCapacity, float loadFactor) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity: " +
                                           initialCapacity);
    //HashMap 的最大容量只能是 MAXIMUM_CAPACITY,哪怕传入的数值大于最大容量,也按照最大容量赋值
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    //加载因子必须大于0
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " +
                                           loadFactor);
    this.loadFactor = loadFactor;
    //设置扩容阈值和1.7类似,目前该阈值不是正真的阈值
    this.threshold = tableSizeFor(initialCapacity);
}
//将传入的子Map中的全部元素逐个添加到HashMap中
public HashMap(Map<? extends K, ? extends V> m) {
    this.loadFactor = DEFAULT_LOAD_FACTOR;
    putMapEntries(m, false);
}

Node节点

前 1.7 是 Entry 结点,1.8 则是 Node 结点,其实相差不大,因为都是实现了 Map.Entry (Map 接口中的 Entry 接口)接口,即,实现了 getKey() , getValue() , equals(Object o )和 hashCode() 等方法

static class Node<K,V> implements Map.Entry<K,V> {
    //hash 值
    final int hash;
    //键
    final K key;
    //值
    V value;
    //后继,链表下一个结点
    Node<K,V> next;
    //全参构造器
    Node(int hash, K key, V value, Node<K,V> next) {
        this.hash = hash;
        this.key = key;
        this.value = value;
        this.next = next;
    }
    //返回与此项对应的键
    public final K getKey()        { return key; }
    //返回与此项对应的值
    public final V getValue()      { return value; }
    public final String toString() { return key + "=" + value; }
    //hash 值
    public final int hashCode() {
        return Objects.hashCode(key) ^ Objects.hashCode(value);
    }
    public final V setValue(V newValue) {
        V oldValue = value;
        value = newValue;
        return oldValue;
    }
    //判断2个Entry是否相等,必须key和value都相等,才返回true  
    public final boolean equals(Object o) {
        if (o == this)
            return true;
        if (o instanceof Map.Entry) {
            Map.Entry<?,?> e = (Map.Entry<?,?>)o;
            if (Objects.equals(key, e.getKey()) &&
                    Objects.equals(value, e.getValue()))
                return true;
        }
        return false;
    }
}

put()方法

//添加键值对
public V put(K key, V value) {
  /*
   *参数一: 调用hash()方法
   *参数二: 键
   *参数三: 值
   **/
  return putVal(hash(key), key, value, false, true);
}

hash()方法

static final int hash(Object key) {
  int h;
  //hashCode和h移位右移16位进行按位异或运算
  return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

putVal()方法

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
    //申明tab 和 p 用于操作原数组和结点
    Node<K,V>[] tab; Node<K,V> p;
    int n, i;
    //如果原数组是空或者原数组的长度等于0,那么通过resize()方法进行创建初始化
    if ((tab = table) == null || (n = tab.length) == 0)
        //获取到创建后数组的长度n
        n = (tab = resize()).length;

    //通过key的hash值和 数组长度-1 计算出存储元素结点的数组中位置(和1.7一样)
    //并且,如果该位置为空时,则直接创建元素结点赋值给该位置,后继元素结点为null
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        //否则,说明该位置存在元素
        Node<K,V> e; K k;
        //判断table[i]的元素的key是否与添加的key相同,若相同则直接用新value覆盖旧value
        if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
            //判断是否是红黑树的结点,如果是,那么就直接在树中添加或者更新键值对
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            //否则,就是链表,则在链表中添加或替换
        else {
            //遍历table[i],并判断添加的key是否已经存在,和之前判断一样,hash和equals
            //遍历完毕后仍无发现上述情况,则直接在链表尾部插入数据
            for (int binCount = 0; ; ++binCount) {
                //如果遍历的下一个结点为空,那么直接插入
                //该方法是尾插法(与1.7不同)
                //将p的next赋值给e进行以下判断
                if ((e = p.next) == null) {
                    //直接创建新结点连接在上一个结点的后继上
                    p.next = newNode(hash, key, value, null);
				//如果插入结点后,链表的结点数大于等7(8-1,即大于8)时,则进行红黑树的转换
				//注意:不仅仅是链表大于8,并且会在treeifyBin方法中判断数组是否为空或数组长度是否小于64
				//如果小于64则进行扩容,并且不是直接转换为红黑树
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    //完成后直接退出循环
                    break;
                }
                //不退出循环时,则判断两个元素的key是否相同
                //若相同,则直接退出循环,进行下面替换的操作
                if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                //否则,让p指向下一个元素结点
                p = e;
            }
        }
        //接着上面的第二个break,如果e不为空,直接用新value覆盖旧value并且返回旧value
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    //添加成功后,判断实际存在的键值对数量size是否大于扩容阈值threshold(第一次时为12)
    if (++size > threshold)
        //若大于,扩容
        resize();
    //添加成功时会调用的方法(默认实现为空)
    afterNodeInsertion(evict);
    return null;
}

resize()方法

//该函数有两种使用情况:初始化哈希表或前数组容量过小,需要扩容
final Node<K,V>[] resize() {
    //获取原数组
    Node<K,V>[] oldTab = table;
    //获取到原数组的容量oldCap
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    //获取原扩容阈值
    int oldThr = threshold;
    //新的容量和阈值目前都为0
    int newCap, newThr = 0;
    if (oldCap > 0) {
        //如果原数组容量大于等于最大容量,那么不再扩容
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        //而没有超过最大容量,那么扩容为原来的2倍
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            //扩容为原2倍
            newThr = oldThr << 1; // double threshold
    }
    //经过上面的if,那么这步为初始化容量(使用有参构造器的初始化)
    else if (oldThr > 0) // initial capacity was placed in threshold
        newCap = oldThr;
    else {               // zero initial threshold signifies using defaults
        //否则,使用的无参构造器
        //那么,容量为16,阈值为12(0.75*16)
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    //计算新的resize的上限
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;
    @SuppressWarnings({"rawtypes","unchecked"})
    //使用新的容量创建一个新的数组
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    //将新的数组引用赋值给table
    table = newTab;
    //如果原数组不为空,那么就进行元素的移动
    if (oldTab != null) {
        //遍历原数组中的每个位置的元素
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                //如果该位置元素不为空,那么上一步获取元素接着置为空
                oldTab[j] = null;
                //判断该元素上是否有链表
                if (e.next == null)
                    //如果无链表,确定元素存放位置,
                    //扩容前的元素位置为 (oldCap - 1) & e.hash ,所以这里的新的位置只有两种可能:1.位置不变,
                    //2.变为 原来的位置+oldCap,下面会详细介绍
                    newTab[e.hash & (newCap - 1)] = e;
                //判断是否是树结点,如果是则执行树的操作
                else if (e instanceof TreeNode)
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else { // preserve order
                    //否则,说明该元素上存在链表,那么进行元素的移动
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    do {
                        next = e.next;
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    //通过loHead和hiHead来保存链表的头结点,然后将两个头结点放到newTab[j]与newTab[j+oldCap]上面去
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

面试问题

存储在Node中的hash值, 是否就是key的hashCode()?
不是。存储的是对Key先做hashCode()计算, 然后再无符号右位移16, 再按位异或

static final int hash(Object key) {
  int h;
  //hashCode和右移16进行按位异或运算
  return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

如何知道一个节点到底存储在Hash表(散列表)的哪个位置?

答案:根据key计算相关的hash值(并不是简单的hashCode()), (数组长度-1) & hash进行计算得出具体的下标, 如果下标只有这一个节点, 直接返回, 非一个节点, 继续在链表或者红黑树中查找

什么时候需要把链表转为红黑树?

答案:链表的节点数大于8(从0开始的, 多以判断条件为 >=7), 数组的长度必须大于等于64,这个时候就会转成红黑树 要么就会数组的扩容。

什么时候扩容?

答案:

​ 情况一:

​ HashMap的Size达到Hash中数组长度*loadFactor(扩容因子)时扩容。即比threshold大, 进行扩容。每次扩容为原数组长度的一倍(<< 1)

​ 情况二:

​ Hash表中某个链表长度到达8,且Hash表中数组的长度小于64.
情况三:
第一次new HashMap()时,会进行resize()操作.

Hash表中数组最大长度为多少?

答案:最大长度为 1<<30. 即:2的30次方法。

计算操作时,发现Hash表中数组长度为2的倍数效率最高,需要一直保持长度为2的倍数。数组长度最大取值为2的31次方减一。所以里面最大的2的倍数为2的30次方。

为什么选择8作为转换值?

​ 答案:元素个数为8的红黑树中,高度为:4.最多查找4次就能找到需要的的值,长度为8的链表,最多找7次。

​ 例如长度为4就转换。红黑树高度为3,最多找3次。链表最多3次。

​ 例如长度为7就转换。红黑树高度3,最多找3次。链表最多6次。多找3次和转换的性能消耗比较不值得。
在源码上可以看出,在理想状态下,受随机分布的 hashCode 影响,链表中的节点遵循泊松分布,而且根据统计,链表中节点数是 8 的概率已经接近千分之一,而且此时链表的性能已经很差了,所以在这种比较罕见和极端的情况下,才会把链表转变为红黑树.
在这里插入图片描述
总结
从Java8开始HashMap底层由数组+链表+红黑树。

使用HashMap时,当使用无参构造方法实例化时,设置扩容因子为默认扩容因子0.75。

当向HashMap添加内容时,会对Key做Hash计算,把得到的Hash值和数组长度-1按位与,计算出存储的位置。

如果数组中该没有内容, 直接存入数组中(Node节点对象), 该下标中有Node对象了, 把内容添加到对应的链表或红黑树中。

如果添加后链表长度大于等于8,会判断数组的长度是否大于等于64,如果小于64对数组扩容,扩容长度为原长度的2倍,扩容后把原Hash表内容重新放入到新的Hash表中。如果Hash长度大于等于64会把链表转换红黑树。

最终判断HashMap中元素个数是否已经达到扩容值(threshold),如果达到扩容值,需要进行扩容,扩容一倍。

反之,如果删除元素后,红黑树的元素个数小于等于6,由红黑树转换为链表。

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值