HashMap源码分析笔记


参考笔记

底层:数组+链表+红黑树

重点

  1. 扰动函数
static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

key的哈希值进行扰动:高16位不变,低16位和高16位做异或运算,赋值给低16位。目的是在数组长度较短的时候减少冲突。

  1. 存放位置的计算
    根据key的哈希值,计算出在数组中存放的位置。
hash & (length - 1)

实际就是取模,hash%length,计算机中直接求余效率不如位移运算,源码中做了优化hash&(length-1)。要想保证hash%length==hash&(length-1),那么length必须是2的n次方;

  1. 添加元素的方法
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict)
  1. 扩容方法
final Node<K,V>[] resize()
  • 当哈希表中的元素个数达到了扩容阈值threshold,就进行扩容。

  • 为什么需要扩容?当元素越来越多的时候,hashMap的查找速度就从O(1)升到O(n),导致链化严重。为了解决冲突带来的查询效率的下降,因此需要扩容。

    1. 初始化扩容。
      ①没有指定capacity。则给定默认值capacity = 16threshold = 12。如果调用new HashMap(); 此时,哈希表的容量和扩容阈值都为0。则给他们赋初值。没有指定大小,默认为16。扩容阈值默认16*0.75。其中,0.75是默认的负载因子。

      ②指定了capacity。通过tableSizeFor方法获取第一个大于等于capacity的2的次方数,并赋值给threshold。分配内存时,通过threshold 大小分配内存。(capacity 哈希表的长度,没有分配内存时,长度为0。)

    1. 非初始化扩容。threshold和数组大小都变为原来的2倍。

对链表进行分解

扩容后数组的长度是原来的2倍。链表的元素需要重新计算存放位置。链表会被分为两个部分。
一部分位于原来位置,另一部分转移到新位置。新位置 = 老位置 + 老数组长度。

  1. tableSizeFor方法
// 此方法核心功能就是求出,大于等于输入长度的2次幂的值
// 如输出:8,输出为8
// 如输出:9,输出为16
static final int tableSizeFor(int cap) {
    int n = cap - 1;
    n |= n >>> 1; //  n = n | (n >>> 1);
    n |= n >>> 2;
    n |= n >>> 4;
    n |= n >>> 8;
    n |= n >>> 16;
    return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
  1. 树化条件
    ①哈希桶中的元素数量>=8
    ②哈希表大小>=64

  2. 取消树化条件
    哈希桶中的元素数量<=6

  • 9
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
HashMap 是 Java 中非常重要的数据结构之一,它实现了 Map 接口,提供了快速的键值对的查找和存储功能。下面是 HashMap源码分析: 1. 数据结构 HashMap 内部实现了一个数组,每个数组元素是一个单向链表,称为桶(bucket)。当我们向 HashMap 中添加一对键值对时,会根据键的哈希值(hashcode)计算出该键值对应该存储在哪个桶中。如果该桶中已经有了该键值对,就将该键值对添加到桶的末尾(Java 8 中是添加到桶的头部),否则就创建一个新的节点添加到桶的末尾。 2. 哈希冲突 如果两个键的哈希值相同,就称为哈希冲突。HashMap 采用链表法解决哈希冲突,即将哈希值相同的键值对存储在同一个桶中,通过单向链表组织起来。当我们根据键查找值时,先根据键的哈希值找到对应的桶,然后遍历该桶中的链表,直到找到目标键值对或者链表为空。 3. 扩容机制 当 HashMap 中的键值对数量超过了桶的数量的时候,就需要对 HashMap 进行扩容。扩容会重新计算每个键值对的哈希值,并将它们存储到新的桶中。Java 8 中,HashMap 的扩容机制发生了一些变化,采用了红黑树等优化方式。 4. 线程安全 HashMap 是非线程安全的,如果多个线程同时操作同一个 HashMap,就有可能导致数据不一致的问题。如果需要在多线程环境下使用 HashMap,可以使用 ConcurrentHashMap。 以上就是 HashMap源码分析,希望对你有所帮助。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值