HashMap的源码初理解

最新推荐文章于 2023-03-07 05:45:00 发布

MR_L_0927

最新推荐文章于 2023-03-07 05:45:00 发布

阅读量192

点赞数

分类专栏： Java

原文链接：https://www.jianshu.com/p/ee0de4c99f87

版权

Java 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

一定义

基于哈希表的 Map，Cloneable, Serializable 接口的实现。与 HashTable 类相似，只不过 HashMap 允许 null 键与 null 值，而且HashMap 是非同步的，HashMap可以通过 Map m = Collections.synchronizeMap(hashMap) 语句进行同步。此类不保证映射的顺序，特别是它不保证该顺序恒久不变。如果经常迭代，为性能考虑，尽量不要把初始容量设置得太高（或将加载因子设置得太低）。HashMap 的实例有两个参数影响其性能，从源码可知参数分别是

int initialCapacity(初始容量), float loadFactor(加载因子)，默认初始容量 16，加载因子 0.75，容量("桶"的数量)不足时重构增加容量至大约为原始容量的2倍。

HashMap的数据结构示意1.1

与其他类，接口关系1.2

二属性

1.序列号

 private static final long serialVersionUID = 362498820763181265L;

2.初始容量 16

static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;

3.默认加载因子

static final int MAXIMUM_CAPACITY = 1 << 30;

4.转换红黑树通上的节点值

static final int TREEIFY_THRESHOLD = 8

HashMap 是采用数组+链表的方式进行存储的，当其节点大于 8 时，存储结构变为红黑树。

5.转换链表桶上的节点值

static final int UNTREEIFY_THRESHOLD = 6;

当节点小于6时，存储结构红黑树结构转换为链表。

6.转换为红黑树时红黑树的最小大小

static final int MIN_TREEIFY_CAPACITY = 64;

7.储存元素的数组,大小为2的幂次倍

transient Node<K,V>[] table;

8.储存元素的集

transient Set<Map.Entry<K,V>> entrySet;

9.键值映射数目，不等于容量。

transient int size;

10.扩容与修改内部结构次数的计数器，用于迭代器的快速失效

transient int modCount;

11.临界值。当实际大小(容量x加载因子)>临界值时，会进行扩容。

int threshold;

比如有1000个非重复键值对需要储存时,此时临界值应 >=1000,若使用的默认扩充因子0.75,算出此时HashMap的容量至少应为1333(1333*0.75=1000).这样,存储数据时才不会自动扩容.又因为tableSizeFor(int cap)方法,当你指定HashMap初始容量n之后,程序会用算法自动计算出一个不小于n的一个二的次幂值,所以直接指定容量为2048.最终应new HashMap<T>(2048)

12.加载因子

final float loadFactor

三构造函数

1.HashMap(int initialCapacity, float loadFactor)

 public HashMap(int initialCapacity, float loadFactor) {
        // 初始容量小与0
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        // 设置的初始容量过大,则默认为最大容量
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        // 加载因子不大于0或非数字
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        //初始化加载因子
        this.loadFactor = loadFactor;
        // 初始化临界值
        this.threshold = tableSizeFor(initialCapacity);
    }

2.HashMap(int initialCapacity)

public HashMap(int initialCapacity) {
        // 加载因子为默认 0.75
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }

3.HashMap()

public HashMap() {
        // 初始容量为 16 ,加载因子为 0.75 (均为默认)
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }

4.HashMap(Map<? extends K, ? extends V> m)

public HashMap(Map<? extends K, ? extends V> m) {
        this.loadFactor = DEFAULT_LOAD_FACTOR;
        // 将映射参数 m 中所有的元素添加到 HashMap 中
        putMapEntries(m, false);
    }

四重要函数

平时使用的方法,如 get,put,remove......在方法体中一般都是调用其他方法,这里主要对被调用的基本方法进行解释

1.putMapEntries(Map<? extends K, ? extends V> m, boolean evict)

 final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
        int s = m.size();
        // m 中含有元素,将其存放至 HashMap 实例中
        if (s > 0) {
            // 如果存放元素的数组未初始化
            if (table == null) { // pre-size
                // 计算出需要创建的 HashMap 容量
                float ft = ((float)s / loadFactor) + 1.0F;
                int t = ((ft < (float)MAXIMUM_CAPACITY) ?
                         (int)ft : MAXIMUM_CAPACITY);
                // 临界值赋值
                if (t > threshold)
                    threshold = tableSizeFor(t);
            }
            // 存放元素的数组已经初始化并且 m 大小大于临界值,调用扩容方法
            else if (s > threshold)
                resize();
            // 循环,调用putVal(hash(key), key, value, false, evict)方法依次插入元素
            for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
                K key = e.getKey();
                V value = e.getValue();
                putVal(hash(key), key, value, false, evict);
            }
        }
    }

2.putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict)

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        // 数组未初始化或长度为0
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        // (n - 1) & hash 确定元素存放在哪个桶中，桶为空，新生成结点放入桶中
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        // 计算出来的桶已含有元素
        else {
            Node<K,V> e; K k;
            // 与桶中的第一个元素比较,如果 key 相等,替换原值为准备加入的值
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            // key 不相等,且为红黑树节点
            else if (p instanceof TreeNode)
                // 放入树中
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            // 为链表结构
            else {
                // 再链表末端插入新节点
                for (int binCount = 0; ; ++binCount) {
                    // 寻找至链表末端
                    if ((e = p.next) == null) {
                        // 插入节点
                        p.next = newNode(hash, key, value, null);
                        // 当节点数量达到临界值,转为红黑树
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    // 判断链表中结点的key值与插入的元素的key值是否相等,相等则替换
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            // 在桶中找到与插入元素 key 值相等的节点
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                // 新值代替旧值
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                // 返回旧值
                afterNodeAccess(e);
                return oldValue;
            }
        }
        // 修改计数器 +1
        ++modCount;
        // 实际值大于临界值扩容
        if (++size > threshold)
            resize();
        // 插入后回调
        afterNodeInsertion(evict);
        return null;
    }

3.resize()

 final Node<K,V>[] resize() {
        // 保存当前 table 为 旧table
        Node<K,V>[] oldTab = table;
        // 当前 table 容量为 旧容量
        int oldCap = (oldTab == null) ? 0 : oldTab.length;
        // 保存当前 table 临界值为 旧临界值
        int oldThr = threshold;
        // 新table 的 新容量 与 新临界值
        int newCap, newThr = 0;
        /**
           resize（）函数在size　> threshold时被调用。oldCap大于 0 代表原来的 table 表非空，
           oldThr（threshold） 为 oldCap × load_factor
        */
        if (oldCap > 0) {
            // 旧容量 HashMap 的最大容量
            if (oldCap >= MAXIMUM_CAPACITY) {
                // 临界值返回 int 类整数的最大值是 2 的 31 次方 - 1 = 2147483647
                threshold = Integer.MAX_VALUE;
                // 无法扩容，返回 旧table
                return oldTab;
            }
            // 容量翻倍后为 旧容量 的2倍并且小于最大容量，且 旧容量 大于默认容量16
            else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                     oldCap >= DEFAULT_INITIAL_CAPACITY)
                // 新临界值 = 旧临界值 翻倍
                newThr = oldThr << 1; // double threshold
        }
        // 旧临界值 大于0
        else if (oldThr > 0) // initial capacity was placed in threshold
            newCap = oldThr;
        /**
          resize（）函数在table为空被调用。oldCap 小于等于 0 且 oldThr 小于等于0，用户调用 HashMap()构造函数创建的　HashMap，所有值均采用默认值，oldTab（Table）表为空，oldCap为0，oldThr等于0，
        */
        else {               // zero initial threshold signifies using defaults
            newCap = DEFAULT_INITIAL_CAPACITY;
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
        }
        // 新临界值 为0
        if (newThr == 0) {
            // 新容量 与 加载因子 计算出 新临界值 并赋值
            float ft = (float)newCap * loadFactor;
            newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                      (int)ft : Integer.MAX_VALUE);
        }
        // 修改临界值为 新临界值
        threshold = newThr;
        // 初始化 table 为计算出来的 新table
        @SuppressWarnings({"rawtypes","unchecked"})
            Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        table = newTab;
        // 将 旧table 中的节点 rehash 到 新table 中
        if (oldTab != null) {
            for (int j = 0; j < oldCap; ++j) {
                Node<K,V> e;
                if ((e = oldTab[j]) != null) {
                    oldTab[j] = null;
                    // 旧table 节点只有一个,直接在 新table 中定位
                    if (e.next == null)
                        newTab[e.hash & (newCap - 1)] = e;
                    // 节点为树节点,进行红黑树的 rehash
                    else if (e instanceof TreeNode)
                        ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                    // 链表
                    else { // preserve order
                        Node<K,V> loHead = null, loTail = null;
                        Node<K,V> hiHead = null, hiTail = null;
                        Node<K,V> next;
                        // 将同一桶中的元素根据(e.hash & oldCap)是否为0进行分割，分成两个不同的链表，完成rehash
                        do {
                            next = e.next;
                            //最高位为0，这是索引不变的链表。
                            if ((e.hash & oldCap) == 0) {
                                if (loTail == null)
                                    loHead = e;
                                else
                                    loTail.next = e;
                                loTail = e;
                            }
                            //最高位为1 （这是索引发生改变的链表）
                            else {
                                if (hiTail == null)
                                    hiHead = e;
                                else
                                    hiTail.next = e;
                                hiTail = e;
                            }
                        } while ((e = next) != null);
                        // 原bucket位置的尾指针不为空(即还有node)
                        if (loTail != null) {
                        	// 链表最后需要有一个null
                            loTail.next = null;
                            // 链表头指针放在新桶的相同下标(j)处
                            newTab[j] = loHead;
                        }
                        if (hiTail != null) {
                            hiTail.next = null;
                            newTab[j + oldCap] = hiHead;
                        }
                    }
                }
            }
        }
        return newTab;
    }

4.getNode(int hash, Object key)

final Node<K,V> getNode(int hash, Object key) {
        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
        // table 已经初始化且 桶 中 节点 不为空
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
        	// 与 桶 中第一个元素相同,返回第一个元素
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                return first;
            // 桶 中含有多个 节点
            if ((e = first.next) != null) {
            	// 为树节点
                if (first instanceof TreeNode)
                	// 在树中查找
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                // 为链表,从链表第一个元素开始,若未找到,找至最后
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        return null;
    }

5.removeNode(int hash, Object key, Object value,boolean matchValue, boolean movable);

final Node<K,V> removeNode(int hash, Object key, Object value,
                               boolean matchValue, boolean movable) {
        Node<K,V>[] tab; Node<K,V> p; int n, index;
        // 如果 节点数组 tab 不为空且长度 n 大于 0,并且根据hash定位到的节点对象p（该节点为 树的根节点 或 链表的首节点）不为空,需要从该节点p向下遍历，找到那个和key匹配的节点对象
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (p = tab[index = (n - 1) & hash]) != null) {
        	// 初始化一个临时的 节点,键,值
            Node<K,V> node = null, e; K k; V v;
        	// 如果当前节点的键和 key 相等，那么当前节点就是要删除的节点，赋值给node
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                node = p;
            // 至此并未匹配到,若 p 无下一节点,则找不到 key 对应节点,无法删除,返回 null;若 p 有下一节点,则 p 为链表或红黑树
            else if ((e = p.next) != null) {
            	// 红黑树型,调用 getTreeNode 方法从树结构中查找满足条件的节点
                if (p instanceof TreeNode)
                    node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
                // 链表型,从头到尾与传入节点 key 进行对比
                else {
                    do {
                    	// 找到与 key 匹配节点,将节点赋值给 e 并跳出循环.
                        if (e.hash == hash &&
                            ((k = e.key) == key ||
                             (key != null && key.equals(k)))) {
                            node = e;
                            break;
                        }
                        // 把当前节点 p 指向 e，让 p 存储的永远为下一次循环里 e 的父节点，如果下一次 e 匹配上了，那么 p 就是 node 的父节点
                        p = e;
                    } while ((e = e.next) != null);// 链表 e 含有下一个节点,则继续匹配
                }
            }
            // 如果 node 不为空，说明根据 key 匹配到了要删除的节点;如果不需要对比该节点的 value值 或者需要对比 value值 ,且 value值 相等,那么可以删除该 node 节点
            if (node != null && (!matchValue || (v = node.value) == value || 
                                 (value != null && value.equals(v)))) {
                if (node instanceof TreeNode)
                    ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
                else if (node == p)
                    tab[index] = node.next;
                else
                    p.next = node.next;
                ++modCount;
                --size;
                afterNodeRemoval(node);
                return node;
            }
        }
        return null;
    }

五其他

有注意到,在很多地方都使用了 Node<K,V>,TreeNode<K,V> 这两个类均为 HashMap 中的静态内部类,一个为链表结构时的数据存储对象,一个为红黑树结构时的数据存储对象.不理解这两个内部类的原理对其他含有这两个类的方法的理解就会多些困难.个人建议查看源码时最好先理解这两个内部类.

1.Node<K,V>

原 HashMap 内部类名为 Entry<K,V>,如今改为 Node<K,V>
static class Node<K,V> implements Map.Entry<K,V> {
    final int hash; // 对key的hashcode值进行hash运算后得到的值，存储在 Node，避免重复计算
    final K key;    // key唯一
    V value;        // 不唯一
    Node<K,V> next; // 存储指向下一个 Node 的引用，单链表结构引用，防止 key 值不同，hash 值相同.

    Node(int hash, K key, V value, Node<K,V> next) {
        this.hash = hash;
        this.key = key;
        this.value = value;
        this.next = next;
    }

    public final K getKey()        { return key; }
    public final V getValue()      { return value; }
    public final String toString() { return key + "=" + value; }

    public final int hashCode() {
        return Objects.hashCode(key) ^ Objects.hashCode(value);
    }
    // 同一个key时，新值替换旧值，返回旧值
    public final V setValue(V newValue) {
        V oldValue = value;
        value = newValue;
        return oldValue;
    }

    public final boolean equals(Object o) {
        if (o == this)
            return true;
        if (o instanceof Map.Entry) {
            Map.Entry<?,?> e = (Map.Entry<?,?>)o;
            if (Objects.equals(key, e.getKey()) &&
                Objects.equals(value, e.getValue()))
                return true;
        }
        return false;
    }
}

2.TreeNode<K,V>

这个内部类含有500行左右代码,这里就不逐行展示了.可以自己阅读下.

转载自 https://www.jianshu.com/p/ee0de4c99f87 ，添加了一些自己的理解。有些详细过程还不是很清楚，比如扩充时的具体过程，还需要学习。由于水平有限,难免有些错误,欢迎指教.

MR_L_0927

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HashMap的源码初理解

一定义基于哈希表的 Map，Cloneable, Serializable接口的实现。与 HashTable 类相似，只不过 HashMap 允许 null 键与 null 值，而且HashMap 是非同步的，HashMap可以通过 Map m = Collections.synchronizeMap(hashMap) 语句进行同步。此类不保证映射的顺序，特别是它不保证该顺序恒久不变。如果...
复制链接

扫一扫