【Java集合】HashMap的tableSizeFor()源码详解

目录

一、HashMap的四个构造方法

二、tableSizeFor方法

2.1 算法原理

2.2 算法演示

2.3 总结


tableSizeFor()是在HashMap的构造方法中被调用过的方法,首先我们先来简单讲一下构造方法。

一、HashMap的四个构造方法

HashMap 中有四个构造方法,它们分别如下:

/**
 * 默认构造函数。 默认初始容量是16和负载因子是0.75
 */
public HashMap() {
    this.loadFactor = DEFAULT_LOAD_FACTOR; // all   other fields defaulted
}

/**
 * 包含另一个“Map”的构造函数,包含另一个Map的映射,如果被映射的Map是一个null会抛出空指针异常。负载因子是默认的
 * 直接传入存储了要添加进HashMap的key-value对的map,来构造HashMap
 */
public HashMap(Map<? extends K, ? extends V> m) {
	//将默认的负载因子赋值给成员变量loadFactor
    this.loadFactor = DEFAULT_LOAD_FACTOR;
	//调用PutMapEntries()来完成HashMap的初始化赋值过程
    putMapEntries(m, false);//下面会分析到这个方法
}

/**
 * 指定“容量大小”的构造函数,直接使用默认负载因子0.75
 */
public HashMap(int initialCapacity) {
    this(initialCapacity, DEFAULT_LOAD_FACTOR);
}


/**
* 构造一个空的HashMap并指定初始容量和负载因子。
* 要注意HashMap源码里面并没有专门的一个属性来存储数组的容量,而是通过threshold来简介限制数组容量的
* 通过将自定义初始化数组容量传入tableSizeFor()方法,计算得出initialCapacity容量大小应该对应的阈值threshold大小
* 这样当数组内元素数大于threshold,就会触发扩容操作,间接限定了数组容量大小
**/
public HashMap(int initialCapacity, float loadFactor) {
    //如果初始容量小于0,抛出非法参数异常
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity);
    //如果初始容量大于最大的容量也就是2^30,那么就按照最大的初始容量赋值。
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    //如果负载因子小于0或者是NaN(float NaN = 0.0f / 0.0f;)也会抛出非法参数异常
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " + loadFactor);
    
    // 设置重载因子
    this.loadFactor = loadFactor;
    // 调用tableSizeFor方法计算出不小于initialCapacity的最小的2的幂的结果,并赋给成员变量threshold
    // 注意,这里赋给threshold并不是扩容阈值,只是临时赋值。
    //此时HashMap还没有创建数组,当插入数据的时候会判断该HashMap是否已经初始化,那个时候就会执行resize()方法进行一次扩容,就会重新计算一正确的扩容阈值赋值给threshold
    this.threshold = tableSizeFor(initialCapacity);
}
  1. 此处仅用于接收初始容量大小(capacity)、加载因子(Load factor),但仍无真正初始化哈希表即初始化存储数组table),仅仅是声明了HashMap对象。
  2. 此处先给出结论:真正初始化哈希表(初始化存储数组table)是在第1次添加键值对时,即第1次调用put()时。下面会详细说明

二、tableSizeFor方法

/**
 * 计算出大于等于参数的第一个2的幂次方
 * 例如:1返回1,3返回4,8返回8,9返回16,125返回128,
 * 如果参数大于默认最大值,则容量取默认最大值。
 */
static final int tableSizeFor(int cap) {
    int n = cap - 1;      //容量减1,为了防止初始化容量已经是2的幂的情况,最后有+1运算。如果cap已经是2的幂, 又没有执行这个减1操作,则执
                                                // 行完后面的几条无符号右移操作之后,返回的capacity将是这个cap的2倍。
    n |= n >>> 1;         //将n无符号右移一位再与n做或操作
    n |= n >>> 2;         //将n无符号右移两位再与n做或操作
    n |= n >>> 4;         //将n无符号右移四位再与n做或操作
    n |= n >>> 8;         //将n无符号右移八位再与n做或操作
    n |= n >>> 16;        //将n无符号右移十六位再与n做或操作
    //如果入参cap为小于或等于0的数,那么经过cap-1之后n为负数,n经过无符号右移和或操作后仍未负 
    //数,所以如果n<0,则返回1;如果n大于或等于最大容量,则返回最大容量;否则返回n+1
    return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}

其中:

a |= b  即为 a = a|b

>>>  是无符号右移运算符  无论正负,右移后,高位填充0

2.1 算法原理

要理解这个方法的核心,关键在于中间五步移位加上或运算。

这个算法的原理:2的整数幂用二进制表示都是最高有效位为1,其余全是0,比如十进制8和32,下图只用了一个字节示意。

对任意十进制数转换为2的整数幂,结果是这个数本身的最高有效位的前一位变成1,最高有效位以及其后的位都变为0

通过上面理论基础,我们可以得出该算法的核心思想是,将最高有效位以及其后的位都变为1,最后再+1,就进位到前一位变成1,其后所有的满20。所以关键是如何将最高有效位后面都变为1

2.2 算法演示

下面用图来进行演示。这里将十进制的25转换为32。

作者的做法是先移位,再或运算。

右移一位,再或运算,就有两位变为1;

右移两位,再或运算,就有四位变为1

最后右移16位再或运算,保证32位的int类型整数最高有效位之后的位都能变为1.

全过程示意图

初始容量-1

之所以在开始移位前先将容量-1,是为了避免给定容量已经是8,16这样2的幂时,不减一直接移位会导致得到的结果比预期大。比如预期16得到应该是16,直接移位的话会得到32。在上图中就是所有x本身已经是0的情况下,不减1得到的结果变大了。

初始值

选取任意int类型数字,下图x表示不确定0或者1.

我们目的是将所有的x变为1,如下图

最后+1,就能进位得到2的整数幂。

我们要做的就是不断通过右移+或运算来达到目的。

右移一位+或运算

可以看出,右移一位再或运算,有两位变成了1。

右移二位+或运算

右移两位再或运算,有四位变成了1。

右移四位+或运算

右移四位再或运算,有八位变成了1。

右移八位+或运算

右移八位再或运算,有十六位变成了1。

右移十六位+或运算

右移十六位再或运算,注意这里不是三十二位全变,而是最高位后面的全变1。

结果+1

可以看出,不管x是多少,我们都能将其转换为1。而且分别经过1,2,4,8,16次转换,不管这个int类型值多大,我们都会将其转换,只是值较小时,可能多做几次无意义操作。

2.3 总结

这个方法之所以高效,是因为移位运算和或运算都属于比较底层的操作,代码的数量不会比最终的指令数多,也就是通过几个简单操作实现了我们的目的。但其实第一次看HashMap这个构造方法的时候,有一些不理解,就是为什么传入的指定初始容量initialCapacity,通过计算得到了大于等于initialCapacity的第一个2的幂次方,这个值就应该是HashMap容量capacity。然而却把这个capacity赋值给了threshold。

this.threshold = tableSizeFor(initialCapacity);

开始就觉得这里写很奇怪,觉得应该是这样写:

this.threshold = tableSizeFor(initialCapacity) * this.loadFactor;

觉得这样才符合threshold的意思(当HashMap的size到达threshold这个阈值时会扩容)。 

但是后来才意识到在构造方法中,并没有对table这个成员变量进行初始化,table的初始化被推迟到了put方法中,在put方法中会对threshold重新计算。这个源码在后面会详细讲解。


参考资料:https://www.cnblogs.com/xiyixiaodao/p/14483876.html

  • 14
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
HashMapJava中最常用的哈希表实现之一,它基于哈希表实现了Map接口。以下是HashMap源码的详细解释: HashMap内部是由一个数组和链表组成的,数组的每个元素称为桶,每个桶存储一个链表(可能为空),链表中的每个节点都是一个键值对(key-value pair)。 以下是HashMap的主要属性: ```java transient Node<K,V>[] table; // 存储元素的数组 transient int size; // 元素大小 int threshold; // 扩容阈值 final float loadFactor; // 负载因子 ``` 其中,table是一个transient修饰的Node数组,存储HashMap中的元素;size表示HashMap中元素的个数;threshold表示HashMap的扩容阈值,即当元素个数达到这个值时就需要扩容;loadFactor是负载因子,用于决定HashMap何时需要扩容。 以下是HashMap的主要方法: 1. put(K key, V value) :将指定的键值对添加到HashMap中,如果键已经存在,则更新对应的值。 2. get(Object key):获取指定键对应的值,如果键不存在则返回null。 3. remove(Object key):从HashMap中删除指定的键值对,如果键不存在则返回null。 4. clear():从HashMap中删除所有的键值对。 5. resize():扩容HashMap,将table的大小增加一倍。 6. hash(Object key):计算键的哈希值。 7. getNode(int hash, Object key):获取指定键的节点。 8. putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict):实际执行put操作的方法,会根据指定的参数决定是否更新已有键的值、是否删除过期键等。 HashMap的put方法实现如下: ```java public V put(K key, V value) { // 计算键的哈希值 int hash = hash(key); // 计算键在table数组中的索引 int i = indexFor(hash, table.length); // 遍历桶中的链表,查找指定键 for (Node<K,V> e = table[i]; e != null; e = e.next) { Object k; if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { // 如果键已经存在,则更新对应的值 V oldValue = e.value; e.value = value; e.recordAccess(this); return oldValue; } } // 如果指定键不存在,则创建新的节点,并将其添加到桶的链表中 modCount++; addEntry(hash, key, value, i); return null; } ``` 在这个方法中,我们首先计算键的哈希值,然后计算键在table数组中的索引。接着,我们遍历桶中的链表,查找指定键,如果键已经存在,则更新对应的值。否则,我们创建新的节点,并将其添加到桶的链表中。 HashMap的get方法实现如下: ```java public V get(Object key) { // 计算键的哈希值 int hash = hash(key); // 计算键在table数组中的索引 int i = indexFor(hash, table.length); // 遍历桶中的链表,查找指定键 for (Node<K,V> e = table[i]; e != null; e = e.next) { Object k; if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { // 如果找到指定键,则返回其对应的值 return e.value; } } // 如果指定键不存在,则返回null return null; } ``` 在这个方法中,我们首先计算键的哈希值,然后计算键在table数组中的索引。接着,我们遍历桶中的链表,查找指定键,如果找到指定键,则返回其对应的值。 HashMap的remove方法实现如下: ```java public V remove(Object key) { // 计算键的哈希值 int hash = hash(key); // 计算键在table数组中的索引 int i = indexFor(hash, table.length); // 遍历桶中的链表,查找指定键 Node<K,V> prev = table[i]; Node<K,V> e = prev; while (e != null) { Node<K,V> next = e.next; Object k; if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { modCount++; size--; if (prev == e) { table[i] = next; } else { prev.next = next; } e.recordRemoval(this); return e.value; } prev = e; e = next; } // 如果指定键不存在,则返回null return null; } ``` 在这个方法中,我们首先计算键的哈希值,然后计算键在table数组中的索引。接着,我们遍历桶中的链表,查找指定键,如果找到指定键,则从链表中删除节点,并返回其对应的值。否则,我们返回null。 以上就是HashMap源码的详细解释。HashMap是一个非常常用且实用的数据结构,它的实现原理也非常值得深入学习和理解。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值