HashMap（jdk1.8）源码分析（一）

最新推荐文章于 2024-03-19 21:03:37 发布

原创最新推荐文章于 2024-03-19 21:03:37 发布 · 196 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#java #hashmap #数据结构

数据结构专栏收录该内容

2 篇文章

订阅专栏

本文深入分析HashMap（jdk1.8）的核心参数与方法，包括TREEIFY_THRESHOLD、DEFAULT_INITIAL_CAPACITY等，详细解读put()、putVal()及resize()方法，探讨哈希冲突解决方案，以及链表转红黑树的条件。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

核心参数：

TREEIFY_THRESHOLD

/**
 * 链表节点个数超过该值时，将链表转化为红黑树
 */
static final int TREEIFY_THRESHOLD = 8;

DEFAULT_INITIAL_CAPACITY

/**
 * 默认的初始数组长度，既无参构造方法创建HashMap时的容量
 */
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

DEFAULT_LOAD_FACTOR

/**
 * 默认的负载因子，负载因子太大查询效率低，负载因子太小频繁扩容，空间利用率低
 */
static final int DEFAULT_LOAD_FACTOR = 0.75f;

MAXIMUM_CAPACITY

/**
 * 最大容量
 */
static final int MAXIMUM_CAPACITY = 1 << 30;

核心方法：

put()

	public V put(K key, V value) {
		/**
		 * put方法直接调用putVal方法
		 * 参数含义：
		 * key的hash值
		 * key值
		 * value值
		 * onlyIfAbsent 是否不覆盖原有值
		 * evict table是否创建完成
		 */
        return putVal(hash(key), key, value, false, true);
    }

putVal()

	// 判断Node<K,V>[] table 是否已经初始化
	// 若未初始化，调用resize()方法初始化
	if ((tab = table) == null || (n = tab.length) == 0)
            	n = (tab = resize()).length;

	// n = tab.length
	// 判断数组位置(n-1)&hash是否有值，即是否存在哈希冲突
	// 若不存在哈希冲突，调用newNode()方法插入键值对
	if ((p = tab[i = (n - 1) & hash]) == null)
            	tab[i] = newNode(hash, key, value, null);

解决哈希冲突部分代码：

	// p = tab[i = (n - 1) & hash]
	// 如果当前位置的对象p的哈希值与待插入的对象的哈希值相同，并且，key值相同，直接覆盖value值
	// 这里判断的是数组中的对象，即链表的头节点或树的根结点？
	if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
				// 记录key值相同的对象
                e = p;

	// 否则，判断p对象是否为树节点对象，即是否已经从链表转化为树结构
	// 若是将待插入的对象放入红黑树中
	else if (p instanceof TreeNode) 
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

	// 否则，拉链法解决冲突
	// 遍历链表
    for (int binCount = 0; ; ++binCount) {
    	 // 如果p对象的下个节点为空
         if ((e = p.next) == null) {
         	 // 将待插入的对象放在p节点的后面（尾插法）
             p.next = newNode(hash, key, value, null);
             // static final int TREEIFY_THRESHOLD = 8 
             // 当链表的节点个数超过TREEIFY_THRESHOLD时
             if (binCount >= TREEIFY_THRESHOLD - 1) {// -1 for 1st
             	 // 链表转化为红黑树
                 treeifyBin(tab, hash);
             }
             break;
         }
         // e = p.next
         // 判断e节点的对象是否与待插入的对象key值相同
         if (e.hash == hash &&
             ((k = e.key) == key || (key != null && key.equals(k)))) {
             // 跳出循环，与待插入对象key值相同的对象为链上某节点
             break;
         }
         // 向后遍历
         p = e;
     }

	// e对象记录的是与待插入对象key值相同的对象
	if (e != null) { // existing mapping for key
        V oldValue = e.value;
        // onlyIfAbsent 是否不覆盖原有值
        if (!onlyIfAbsent || oldValue == null) {
        	// 覆盖value值
            e.value = value;
        }
        // LinkedHashMap中有实现方法
        afterNodeAccess(e);
        // 返回旧值
        return oldValue;
    }

插入新对象完成后：

	// 修改次数加1
	++modCount;
	// size：键值对个数
	// threshold：扩容的临界值 （容量 * 负载因子）
	// 判断是否需要扩容（大于触发，等于不触发）
    if (++size > threshold) {
    	// 扩容
        resize();
    }
    // LinkedHashMap中有实现方法
    afterNodeInsertion(evict);
    return null;

p.s.

数组索引的计算： (table.length - 1) & hash(key)
使用拉链法解决哈希冲突
判断key值是否相同时既要使用hashCode()方法又要使用equals()方法，因此自定义类型用做key时要重写这两个方法
由于HashSet是利用HashMap实现的，因此自定义类型存入HashSet中也要重写这两个方法
向链表中新增节点时是尾插法
put方法和putVal方法的返回值为key对应的旧值，没有旧值返回null
总键值对个数大于临界值时触发扩容，等于不触发
扩容阈值为 容量 * 负载因子

resize()

设置容量值newCap和扩容临界值newThr

	Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    // 原table存在
    if (oldCap > 0) {
    	// static final int MAXIMUM_CAPACITY = 1 << 30; (2^31) 
    	// 旧数组容量大于等于最大容量
        if (oldCap >= MAXIMUM_CAPACITY) {
        	// 临界值设为Integer.MAX_VALUE（2^31 - 1）
            threshold = Integer.MAX_VALUE;
            // 返回原数组
            return oldTab;
        } 
        // static final int DEFAULT_INITIAL_CAPACITY = 1 >> 4; (16)
        // 新容量扩为原来的2倍后是否仍小于最大容量，并且，原容量是否大于等于初始容量
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY) {
            // 新的扩容临界值扩大为原来的2倍
            // 初始值为 16 * 0.75 = 12
            newThr = oldThr << 1; // double threshold
        }
    }
    // 旧的扩容临界值大于0
    // HashMap(int initialCapacity) 构造函数会走该分支
    // HashMap(int initialCapacity) 调用 HashMap(int initialCapacity, float loadFactor)， 该构造方法设置了负载因子和扩容临界值，扩容临界值根据初始容量计算（tableSizeFor）
    else if (oldThr > 0) // initial capacity was placed in threshold
    		// 新的容量为旧的扩容临界值
            newCap = oldThr;
    // 无参构造函数 HashMap()（无参构造函数中会给负载因子赋值为0.75）后，第一次调用put()时，容量身为默认容量16，扩容临界值为16 * 0.75 = 12
    // 否则，容量设置为默认的16，扩容临界值设置为12（16 * 0.75）
    else {               // zero initial threshold signifies using defaults
            newCap = DEFAULT_INITIAL_CAPACITY;
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
	// 如果新的扩容临界值为0
	if (newThr == 0) {
			// 容量 * 负载因子
            float ft = (float)newCap * loadFactor;
            // 若新容量和ft均小于最大容量，新扩容临界值为ft；否则为Integer.MAX_VALUE
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
    }
    // 新的扩容临界值覆盖当前临界值
    threshold = newThr;
    /**
     * 无论设置的初始容量为多少，都将变为2的幂，计算函数为tableSizeFor
     * 扩容临界值始终保证为 容量 * 负载因子
     */

创建新的数组：

	// 新建数组，容量为newCap
	Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
	// 替换table
    table = newTab;

将旧数组的对象存入新数组中：

	// 若旧数组存在
	if (oldTab != null) {
		// 遍历原数组
        for (int j = 0; j < oldCap; ++j) {
        	Node<K,V> e;
        	// 当前数组位置有对象
	        if ((e = oldTab[j]) != null) {
	        	...
	        }
        }
    }

遍历原数组，对值不为null的对象处理的代码：

	oldTab[j] = null;
	// e = oldTab[j]
	// 如果当前位置未形成链表或红黑树
    if (e.next == null)
    	// 将该对象存入新的数组，索引为 e.hash & (newCap - 1)
    	// e.hash即为hash（e.key)， newCap即为table.length()，保证了索引规则的一致
        newTab[e.hash & (newCap - 1)] = e;
    // 如果当前节点为树节点，即当前对象为红黑树的根节点
    else if (e instanceof TreeNode)
    	// 存入红黑树
        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
    else { // preserve order
		// 存在链表的情况
	}

旧链表对象存入新数组：

	Node<K,V> loHead = null, loTail = null;
    Node<K,V> hiHead = null, hiTail = null;
    Node<K,V> next;
    do {
    	// e = oldTab[j] 
        next = e.next;
        // 将原链表拆分成两个链表 
        if ((e.hash & oldCap) == 0) {
            if (loTail == null) {
                loHead = e;
            }
            else {
            	// 尾插法
                loTail.next = e;
            }
            loTail = e;
        }
        else {
            if (hiTail == null) {
                hiHead = e;
            }
            else {
            	// 尾插法
                hiTail.next = e;
            }
            hiTail = e;
        }
    } while ((e = next) != null);
	// 
	if (loTail != null) {
        loTail.next = null;
        // j位置为原链表对象的位置
        // e.hash & oldCap == 0 的链表存在j
        newTab[j] = loHead;
    }
    if (hiTail != null) {
        hiTail.next = null;
        // e.hash & oldCap != 0 的链表存在 j+oldCap
        newTab[j + oldCap] = hiHead;
    }