2021-05-27

最新推荐文章于 2021-11-05 17:13:35 发布

星崆

最新推荐文章于 2021-11-05 17:13:35 发布

阅读量59

点赞数

分类专栏：笔记文章标签： hashmap java

本文链接：https://blog.csdn.net/weixin_45057286/article/details/117324715

版权

笔记专栏收录该内容

15 篇文章 0 订阅

订阅专栏

HashMap源码分析

1. HashMap概述
	JDK1.8之前，HashMap采用数组+链表的形式实现。
	当使用链表处理冲突的时候，如果hash值相等，那么这些hash值相等的元素都会存储在同一个链表之中，这样的话，我们在通过Key值寻找元素的效率就会变得比较低。
	JDK1.8中，HashMap采用数组+链表+红黑树实现，
	与JDK1.8之前大体相同，不同之处就是在数组+链表的基础上加入了红黑树。使用数组横向存储hash值不同的元素，使用链表纵向存储hash值相同的元素，但是与JDK1.8之前不同的是，点那个链表长度超过8的时候，就会将链表转换为红黑树来进行存储，这样的方式，使我们通过key值寻找元素的效率大大提升。
2. HashMap的特点：
（1）HashMap的键必须是唯一的，不能重复；
（2）HashMap允许null值和null键；
（3）HashMap的线程是不安全的·；
（4）HashMap是无序的，不保证元素的任何特定顺序；
（5）HashMap只能存储对象，所以基本数据类型应该使用其包装类型，如ing应该为·Integer；
（6）HashMap只能使用关联的键来获取值；
（7）HashMap实现了Cloneable和Serializable接口，因此可以拷贝和序列化。

HashMap的重要字段

HashMap 有 5 个非常重要的字段（JDK 版本为 14）
1. transient Node<K,V>[] table;
2. transient int size;
3. transient int modCount;
4. int threshold;
5. final float loadFactor;

1.transient Node<K,V>[] table

Node是HashMap中的一个内部类，实现了Map.Entry接口，其本质是一个映射（键值对）。具体代码如下：

//Node是单向链表，它实现了Map.Entry接口
static class Node<k,v> implements Map.Entry<k,v> {
    final int hash;
    final K key;
    V value;
    Node<k,v> next;
    //构造函数Hash值 键 值 下一个节点
    Node(int hash, K key, V value, Node<k,v> next) {
        this.hash = hash;
        this.key = key;
        this.value = value;
        this.next = next;
    }
 
    public final K getKey()        { return key; }
    public final V getValue()      { return value; }
    public final String toString() { return key + = + value; }
 
    public final int hashCode() {
        return Objects.hashCode(key) ^ Objects.hashCode(value);
    }
 
    public final V setValue(V newValue) {
        V oldValue = value;
        value = newValue;
        return oldValue;
    }
    //判断两个node是否相等,若key和value都相等，返回true。可以与自身比较为true
    public final boolean equals(Object o) {
        if (o == this)
            return true;
        if (o instanceof Map.Entry) {
            Map.Entry<!--?,?--> e = (Map.Entry<!--?,?-->)o;
            if (Objects.equals(key, e.getKey()) &&
                Objects.equals(value, e.getValue()))
                return true;
        }
        return false;
    }
}
由上面的代码可以看出，Node中包含一个next变量，而这个变量就是链表的关键点，hash值相同的元素就是通过next进行关联的。

2.transient int size

size指的是HashMap中实际存储的键值对的数量，与length是不一样的。size在JDK API 1.6.0中的描述如下图所示：

在这里插入图片描述

3.transient int modCoun

modCount 主要用来记录 HashMap 实际操作的次数，以便迭代器在执行 `remove()` 等操作的时候快速抛出 ConcurrentModificationException，因为 HashMap 和 ArrayList 一样，也是 fail-fast 的。

4.int threshold

threshold 用来判断 HashMap 所能容纳的最大键值对数量，它的值等于数组大小 * 负载因子。默认情况下为 12（16 * 0.75），也就是第一次执行 `resize()` 方法的时候。

5. final float loadFactor

loadFactor 为负载因子，默认的 0.75 是对空间和时间效率上的一个平衡选择，一般不建议修改，像我这种工作了十多年的老菜鸟，就从来没有修改过这个值。

hash算法

	从上面的学习之中，我们可以知道，HashMap的底层数据结构是数组+链表（JDK1.8中加入红黑树），所以，在对HashMap进行操作的时候，定位数组的下标就变得极为关键。

1. hash（）方法：（JDK1.8中）

（1）具体源码如下：
static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
（2）代码解析：
首先获取对象的hashCode（）值，然后将hashCode值右移16位，然后将右移所得到的值与原来的hashCode做异或运算，最后返回结果。（其中h>>>16，在JDK1.8中，优化了高位运算的算法，使用了零扩展，无论正数还是负数，都在高位插入0）

2. putVal（）方法：

	在HashMap中，并没有直接提供putVal接口，而是提供了put方法，而put方法就是通过putVal方法来插入元素的。

public V put(K key, V value) {
    // 对key的hashCode()做hash 
    return putVal(hash(key), key, value, false, true);  
}

1. 具体源码如下：
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    // 步骤①：tab为空则创建 
    // table未初始化或者长度为0，进行扩容
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    // 步骤②：计算index，并对null做处理  
    // (n - 1) & hash 确定元素存放在哪个桶中，桶为空，新生成结点放入桶中(此时，这个结点是放在数组中)
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    // 桶中已经存在元素
    else {
        Node<K,V> e; K k;
        // 步骤③：节点key存在，直接覆盖value 
        // 比较桶中第一个元素(数组中的结点)的hash值相等，key相等
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
                // 将第一个元素赋值给e，用e来记录
                e = p;
        // 步骤④：判断该链为红黑树 
        // hash值不相等，即key不相等；为红黑树结点
        else if (p instanceof TreeNode)
            // 放入树中
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        // 步骤⑤：该链为链表 
        // 为链表结点
        else {
            // 在链表最末插入结点
            for (int binCount = 0; ; ++binCount) {
                // 到达链表的尾部
                if ((e = p.next) == null) {
                    // 在尾部插入新结点
                    p.next = newNode(hash, key, value, null);
                    // 结点数量达到阈值，转化为红黑树
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    // 跳出循环
                    break;
                }
                // 判断链表中结点的key值与插入的元素的key值是否相等
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    // 相等，跳出循环
                    break;
                // 用于遍历桶中的链表，与前面的e = p.next组合，可以遍历链表
                p = e;
            }
        }
        // 表示在桶中找到key值、hash值与插入元素相等的结点
        if (e != null) { 
            // 记录e的value
            V oldValue = e.value;
            // onlyIfAbsent为false或者旧值为null
            if (!onlyIfAbsent || oldValue == null)
                //用新值替换旧值
                e.value = value;
            // 访问后回调
            afterNodeAccess(e);
            // 返回旧值
            return oldValue;
        }
    }
    // 结构性修改
    ++modCount;
    // 步骤⑥：超过最大容量 就扩容 
    // 实际大小大于阈值则扩容
    if (++size > threshold)
        resize();
    // 插入后回调
    afterNodeInsertion(evict);
    return null;
}

3.put（）方法

1. 具体源码如下：
	public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}
2. put()方法会先调用hash()方法计算 key 的 hash 值，然后再调用内部方法putVal()：
	final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    HashMap.Node<K,V>[] tab; HashMap.Node<K,V> p; int n, i;
    // ①、数组 table 为 null 时，调用 resize 方法创建默认大小的数组
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    // ②、计算下标，如果该位置上没有值，则填充
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        HashMap.Node<K,V> e; K k;
        // ③、如果键已经存在了，并且 hash 值相同，直接覆盖
        if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        // ④、红黑树处理
        else if (p instanceof HashMap.TreeNode)
            e = ((HashMap.TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
            // ⑤、增加链表来处理哈希冲突
            for (int binCount = 0; ; ++binCount) {
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    // 如果链表长度大于 8 转换为红黑树处理
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                // 如果键已经存在了，并且 hash 值相同，直接覆盖
                if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    // ⑥、超过容量限制，扩容
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}
3. 相关解释：
	如果发生哈希冲突的画，会执行② 处对应的 else 语句，先判断键是否相等，相等的话直接覆盖；否则执行 ④，做红黑树处理；如果不是，会执行 ⑤，把上一个节点的 next 赋值为新的 Node。
	也就是说，如果哈希冲突了，会在数组的同一个位置上增加链表，如果链表的长度大于 8，将会转化成红黑树进行处理。

4.get（）方法

1. 具体源码如下：
	public V get(Object key) {
    HashMap.Node<K,V> e;
    return (e = getNode(hash(key), key)) == null ? null : e.value;
}
2. 首先计算 key 的 hash 值，当 hash 值确定后，键值对在数组中的下标位置也就确定了，然后再调用 `getNode()` 方法：
	final HashMap.Node<K,V> getNode(int hash, Object key) {
    HashMap.Node<K,V>[] tab; HashMap.Node<K,V> first, e; int n; K k;
    if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
        if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        if ((e = first.next) != null) {
            if (first instanceof HashMap.TreeNode)
                return ((HashMap.TreeNode<K,V>)first).getTreeNode(hash, key);
            do {
                if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    return null;
}
3. 其中 `first = tab[(n - 1) & hash]` 就可以快速的确定键对应的值，如果键相等并且键的 hash 相等，则直接返回；如果键的哈希冲突了，就先判断是不是红黑树，不是的话就遍历链表。

星崆

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
2021-05-27

HashMap源码分析1、HashMap概述 JDK1.8之前，HashMap采用数组+链表的形式实现。当使用链表处理冲突的时候，如果hash值相等，那么这些hash值相等的元素都会存储在同一个链表之中，这样的话，我们在通过Key值寻找元素的效率就会变得比较低。 JDK1.8中，HashMap采用数组+链表+红黑树实现，与JDK1.8之前大体相同，不同之处就是在数组+链表的基础上加入了红黑树。使用数组横向存储hash值不同的元素，使用链表纵向存储hash值相同的元素，但是与JDK1.8之前不同
复制链接

扫一扫

专栏目录