HashMap不扩容时的最大容量分析

 HashMap在使用过程中,数据过多时会自动扩容。那么,在扩容之前最多可存多少数据呢?

用无参构造方法创建对象:

          HashMap<String,String> hm = new HashMap<String,String>();

在JDK 7中

addEntry方法会先判断是否需要扩容。

size表示hashmap中已有的键值对数量,此时这个值还不包含即将插入新数据。

threshold是扩容阈值。无参构造方法,数组长度为16,加载因子是0.75,threshold=12。

扩容条件是(size >= threshold) && (null != table[bucketIndex]),表示不但要满足已有键值对数量达到扩容阈值,还得确定数组位置已存在数据,发生hash冲突。反过来说就是,如果数组位置是空的,即使达到阈值也不会扩容。也就是说,未达到阈值或未发生hash冲突时不扩容

插入数据后,再看一下createEntry方法:

键值对的数量会自增,size++;但是却不会重新扩容。

综上所述,可得出结论:

1、HashMap扩容的必要条件是:必须达到阈值且新增的key在数组位置发生hash冲突

2、新key未发生hash冲突,即使达到阈值,也不会扩容。此时hashmap中键值对数量会超过阈值。

既然会超过阈值,那么最多可存多少个键值对呢?

扩容之前,阈值不会被K-V数量影响,我们先让K-V达到阈值12。因为第12个key放入时,map中只有11个key,达不到阈值,不会扩容,所以这第12个key一定可以放入。现在,已经满足扩容的阈值条件了。要想在不扩容的条件下,放入更多的key,就要使新key不满足第二个条件,即不要发生hash冲突。只要数组中有尽可能多的空位,就能放入尽可能多的新key。因为map中已经有数据了,至少会占据一个位置,即12个key全部在同一个位置,那么就会剩下15个空位。新插入的key都不发生hash冲突的情况下,每个key占据一个空位,最多15个。再插入时就会hash冲突了。此时,map中key最多,总共有12+15=27个key

但在jdk8中,put方法调用的putVal方法,先放入key,再扩容。判断新增后的size是否达到阈值,超过阈值再扩容。与是否hash冲突无关。所以,jdk8中最多只能存与阈值相同个数key。

结论:

1、jdk 7,放入key之前先扩容,放入后不重新判断是否扩容。达到阈值且hash冲突时才扩容。不发生hash冲突,可超过阈值。最多存个数:threshold+table.length-1

2、jdk 8,放入key之后再判断扩容。最多存放key个数与阈值相同

 

 

 

 

 

### 回答1: HashMap扩容阈值通常设为 0.75。这是因为,当 HashMap 中的条目数量超过容量的 3/4 ,散列表就可能变得过于稠密,这样就会增加查找的间复杂度。为了避免这种情况,当 HashMap 的条目数量超过阈值,它就会触发扩容操作,将容量增加一倍。这样就可以保证 HashMap 中的条目数量不会超过容量的 3/4,从而最大程度地降低查找的间复杂度。 扩容阈值的具体值并不是固定的,也可以设为其他值。不过,将扩容阈值设为 0.75 已经被证明是一个较优的值,可以在保证效率的同最大限度地减少空间占用。 ### 回答2: HashMap 扩容阈值为0.75是为了在间和空间上达到一个平衡点,既可以保证HashMap的性能,又能够避免频繁的扩容操作。 HashMap是一种基于哈希表实现的数据结构,其内部是由一个数组和链表(或红黑树)组成。当元素个数达到数组容量乘以扩容阈值,就需要对数组进行扩容,使得HashMap具备更大的存储空间。 选择0.75作为扩容阈值是基于平均链表长度的经验值。假设数组容量为N,如果链表长度过长,那么查询一个元素的间复杂度会近似变为O(N),严重影响HashMap的性能。因此,我们希望链表长度尽量保持在一个较小的范围内,采用0.75作为阈值可以有效地控制链表长度。 另一方面,扩容操作会耗费一些间和空间,因为需要重新计算哈希值、重新分配内存、重新插入元素等。如果扩容阈值过小,那么会频繁进行扩容操作,造成性能的浪费。而选择0.75作为阈值,则可以尽量减少扩容的次数,减少间和空间的开销。 当HashMap的元素个数达到容量乘以0.75,就会触发扩容操作,数组容量会扩大为原来的两倍。这样可以保证在大部分情况下,哈希冲突的概率相对较小,链表长度相对较短,从而提高HashMap的性能。所以,0.75被认为是一种比较合理的扩容阈值。 ### 回答3: HashMap 扩容阈值为0.75是为了权衡空间利用率和间复杂度的性能。在HashMap中,存储的数据是以键值对(key-value)的形式组织的。 首先,扩容操作是为了保证HashMap的性能,当HashMap中的元素数量超过阈值,就需要进行扩容操作。而扩容的过程涉及到重新计算哈希值、重新分配存储空间等操作,这些都需要消耗间。 其次,扩容操作还会涉及到重新计算哈希值后的元素重新分布。当扩容阈值过小HashMap会频繁扩容,这样会增加扩容操作的开销。而当扩容阈值过大HashMap在占有过多的空间的情况下进行操作,可能导致空间的浪费。 因此,通过实验和分析,0.75这个值被认为是一个较为适中的扩容阈值,既能保证空间的利用率,又能降低耗扩容操作。当HashMap中的元素数量超过阈值的75%HashMap会自动进行扩容操作,以减少冲突的概率,提高查找等操作的性能。 总之,0.75作为HashMap扩容阈值,是为了在空间利用率和间复杂度之间取得一个平衡,以保证HashMap的性能和效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值