Java HashMap源码分析

置顶 xiangxiongfly915

已于 2022-03-03 14:04:10 修改

阅读量269

点赞数

分类专栏： # Java 集合系列文章标签： Java HashMap

于 2021-07-14 16:34:03 首次发布

本文链接：https://blog.csdn.net/qq_14876133/article/details/118731066

版权

Java 集合系列专栏收录该内容

5 篇文章 1 订阅

订阅专栏

文章目录

HashMap源码分析

HashMap源码分析

概述

在JDK1.7中，HashMap的数据结构为：数组+链表
在JDK1.8中，HashMap优化了数据结构，引入了红黑树，即：数组+链表+红黑树
解决hash冲突问题：
- 无冲突：存放在数组中
- 有冲突，链表长度<8时，存放在单链表中
- 有冲突，链表长度>8时，先存入链表，再链表转红黑树

哈希表和哈希桶

采用哈希函数将记录储存在一块连续的存储空间中，这块连续的储存空间就称之为哈希表
哈希桶是解决哈希表冲突的一种方法，哈希表中同一个位置可能存有多个元素，为应对哈希冲突问题，将哈希表中的每个位置表示一个哈希桶

红黑树

链表不支持随机存取，只能单向遍历，效率很低，如果冲突比较严重，同一个index上的节点很多，那么链表就会很长，此时查找效率就会很低
使用红黑树，可以将查找效率由原来的线性时间变为对数时间，也就是O(n)变为O(logn)，所以为了效率问题，这里直接使用了红黑树，也就是二分的思想。冲突越严重，红黑树的效果就越明显，比如链表长度为1024时，采用链表的效率就是1024，而红黑树就是log(1024)=10，差了100倍!

数据结构

在这里插入图片描述

储存流程

在这里插入图片描述

源码分析

HashMap类简介

public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable

基本属性

//默认初始容量为16
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

//最大容量，2的30次方
static final int MAXIMUM_CAPACITY = 1 << 30;

//默认负载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;

//链表阀值，超过8转红黑树
static final int TREEIFY_THRESHOLD = 8;

//红黑树阀值，小于6转链表
static final int UNTREEIFY_THRESHOLD = 6;

//HashMap容量大于64才允许树化
static final int MIN_TREEIFY_CAPACITY = 64;

//hash桶数组
transient Node<K,V>[] table;

//负载因子
final float loadFactor;

//阀值，threshold=哈希表长度*负载因子，哈希表内元素超过阀值会扩容resize()
int threshold;

//元素数量
transient int size;

Node

Node是HashMap的一个内部类，用于存储key-value值，Node是一个单链表结构

static class Node<K,V> implements Map.Entry<K,V> {
    final int hash;
    final K key;
    V value;
    Node<K,V> next;

    public final int hashCode() {
        return Objects.hashCode(key) ^ Objects.hashCode(value);
    }
}

构造函数

HashMap在初始化的时候会定义初始容积和负载因子。

//无参构造函数，设置默认负载因子
public HashMap() {
    this.loadFactor = DEFAULT_LOAD_FACTOR; 
}

//指定容量
public HashMap(int initialCapacity) {
    this(initialCapacity, DEFAULT_LOAD_FACTOR);
}

//指定容量和负载因子
public HashMap(int initialCapacity, float loadFactor) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity: " +
                                           initialCapacity);
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " +
                                           loadFactor);
    this.loadFactor = loadFactor;
    this.threshold = tableSizeFor(initialCapacity);
}

public HashMap(Map<? extends K, ? extends V> m) {
    this.loadFactor = DEFAULT_LOAD_FACTOR;
    putMapEntries(m, false);
}

put()

HashMap调用put()方法，会先将key值转hash值，通过二次哈希算法（高位运算和取模运算，目的是分散均匀，避免hash冲突），通过hash值计算存储位置。如果没有hash冲突，则将value值存放在指定位置，如果存在hash冲突，则尾插法放入单链表中，当单链表长度大于8时会转红黑树。
JDK1.8中是尾插法，JDK1.7是头插法。

putVal(hash(key), key, value, false, true);

//二次hash算法生成hash值，高位运算和区别运算，均匀分布避免hash冲突
static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;

    //如果哈希表的数组table为空，则通过resize()创建
    //所以哈希表的创建是在第一次调用put()时
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;

    //插入值，会先判断是否有hash冲突
    
    //如果没有hash冲突
    if ((p = tab[i = (n - 1) & hash]) == null)
        //通过hash值找到指定坐标，如果该坐标没有元素则直接插入
        tab[i] = newNode(hash, key, value, null);
    //如果有hash冲突
    else {
        Node<K,V> e; K k;

        //如果hash值、key引用地址、key值都相等，则新值覆盖旧值
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;

        //如果是红黑树，则向树中插入值
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

        //如果是链表
        else {
            //遍历链表节点
            for (int binCount = 0; ; ++binCount) {
                if ((e = p.next) == null) {
                    //尾插法，在末尾插入新的节点
                    p.next = newNode(hash, key, value, null);
                    
                    //如果链表长度>8，则转红黑树
                    if (binCount >= TREEIFY_THRESHOLD - 1) 
                        treeifyBin(tab, hash);
                    break;
                }
                
                //查找到相同的key值
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                
                //更新p指向下一个节点
                p = e;
            }
        }
        
        //新值覆盖旧值操作
        if (e != null) { 
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    
    ++modCount;
    
    //如果容量大于阀值，则resize()扩容操作
    if (++size > threshold)
        resize();
    
    afterNodeInsertion(evict);
    return null;
}

resize()

扩容操作

在这里插入图片描述

//resize使用情况：1.初始化哈希表，2.扩容
final Node<K,V>[] resize() {
    //扩容前数组
    Node<K,V>[] oldTab = table;
    //扩容前数组容量
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    //扩容前阀值
    int oldThr = threshold;
    int newCap, newThr = 0;

    if (oldCap > 0) {
        //如果旧容量大于最大值，则不在扩容
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        //如果旧容量小于最大值，则2倍扩容
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; // double threshold
    }

    //初始化哈希表
    else if (oldThr > 0) // initial capacity was placed in threshold
        newCap = oldThr;
    else {               // zero initial threshold signifies using defaults
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }

    //计算新的阀值
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    //更新阀值
    threshold = newThr;
    //创建新的哈希表
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    //更新哈希表
    table = newTab;

    if (oldTab != null) {
        //遍历旧哈希表
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;

                //元素放入新哈希表中
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                
                //元素放入红黑树
                else if (e instanceof TreeNode)
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                
                //扩容操作，重新计算元素位置
                else { 
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    do {
                        next = e.next;
                        //原索引
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        //原索引+oldCap
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    //原索引放入哈希桶里
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    //原索引+oldCap放入哈希桶里
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

xiangxiongfly915

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
Java HashMap源码分析

文章目录HashMap源码分析概述数据结构储存流程源码分析基本属性Node构造函数put()resize()HashMap源码分析概述在JDK1.7中，HashMap的数据结构为：数组+链表在JDK1.8中，HashMap优化了数据结构，引入了红黑树，即：数组+链表+红黑树解决hash冲突问题：无冲突：存放在数组中有冲突，链表长度<8时，存放在单链表中有冲突，链表长度>8时，先存入链表，再链表转红黑树哈希表和哈希桶采用哈希函数将记录储存在一块连续的存储空间中，这块
复制链接

扫一扫