提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
前言
1.同一个对象,在hashMap与TreeMap的哈希值是一样吗?如何保证hash值的稳定性?
2.HashMap的链表长度超过8的时候,会将链表转换成红黑树。但是hashCode分布良好的话,链表的长度符合泊松分布,长度达到8的概率小于千万分之一。hashCode是如何保持分布良好的?
一、hash值的稳定性
public int hashCode() {
int h = 0;
Iterator<Entry<K,V>> i = entrySet().iterator();
while (i.hasNext())
h += i.next().hashCode();
return h;
}
这段代码通过遍历entrySet()集合的hash值确保了两个包含相同键值对的Map对象生成相同的哈希值,从而保证了哈希值的稳定性。什么是稳定性呢?
稳定性是指,即使键值对的顺序不同,只要两个Map对象包含相同的键值对(键和值都相同),它们的hashCode()返回的值也会相同。
这确保了对于相同内容的Map对象,生成的哈希值具有一致性和稳定性。
举个例子
假设有两个Map对象:
Map<String, Integer> map1 = new HashMap<>();
map1.put("apple", 10);
map1.put("banana", 20);
Map<String, Integer> map2 = new TreeMap<>();
map2.put("banana", 20);
map2.put("apple", 10);
map1是HashMap,map2是TreeMap。尽管这两个Map对象可能以不同的顺序存储这些键值对(HashMap可能按照哈希码分布存储,而TreeMap按照键的字典顺序存储),它们的内容(即键和值的配对)是相同的。
根据前面代码中的hashCode()方法,这两个Map对象的hashCode()值将会是相同的,因为它们包含的键值对是相同的,并且哈希值累加过程对顺序无关。
二、HashMap中的hash值
hash函数
代码如下(示例):
static final int hash(Object key) {
int h;
return(key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
具体步骤
- 检查key是否为null
(key == null) ? 0
如果key是null,这个方法直接返回哈希值0。在许多哈希表实现中,null键通常是允许的,并且会映射到哈希值为0的位置。
- 计算键的原始哈希值
h = key.hashCode()
这一步通过调用key对象的hashCode()方法,计算出它的原始哈希值,并将其存储在变量h中。
- 扰动哈希值以减少冲突
(h = key.hashCode()) ^ (h >>> 16)
首先计算出h的原始哈希值,然后将这个哈希值与它自身的高16位进行异或运算(^是位运算符,用于执行按位异或操作)。
h >>> 16是一个无符号右移操作,将h向右移16位,结果是原始哈希值的高16位被移到低16位的位置,而高位用0填充。
通过h与h >>> 16进行异或操作,原始哈希值的高16位和低16位的信息被混合在一起。
举个例子
假设key.hashCode()的值为0x12345678:
高16位是0x1234,低16位是0x5678。
h >>> 16将高16位移到低16位,结果是0x00001234。
现在,将原始哈希值0x12345678与0x00001234进行异或操作:
0x12345678
^ 0x00001234 得到
0x1234444C
得到的结果0x1234444C
是扰动后的哈希值,它保留了原始哈希值的信息,但也混合了高低位的数据,从而可以更均匀地分布到哈希表中。
总结
hash函数的优点:
使用位运算代替传统的取模运算,加快计算效率
将hashCode的高位与地位进行搅动运算,进一步减少哈希冲突