哈希map结构
已知对象的hash码是一个32位二进制数并且很少出现重复的情况,为什么不直接使用hash码而使用经过运算后的hash值来寻找bin?
先来看寻找bin的代码:
tab[i = (n - 1) & hash]
使用32位的hash值和n-1进行与运算,n-1的值初始状态为1111,随着数据的增加,hashmap扩充容量后n-1的值会多一个二进制位:11111…;
每次扩充hashmap的容量成倍增加,而参与运算的位数只增加了1位。
于是出现了一个问题:在数据量较少时,32位的hash码参与运算时往往只有低位的值参与了有效运算,高位的特征其实是浪费了;
例如:
n-1 :0000 0000 0000 0000 0000 0000 1111 1111
某hash码:xxxx xxxx xxxx xxxx xxxx xxxx 1010 1110
无论高位有多复杂,实质参与运算的只有后8位而已。
于是便出现以下代码:
(h = key.hashCode()) ^ (h >>> 16)
用hash码高16位和低16位进行异或后得到的hash值,(此时的值低16位同时具有高位和低位的特征),再去参与寻找bin的运算,可以适当降低只有低位参与运算时引起的hash冲突。
顺带一句:在ConcurrentHashMap中对map进行增删改时会对相应的bin进行上锁来保证安全。
部分代码如下:
else { //发生哈希冲突或替换旧值
V oldVal = null;
synchronized (f) {//加锁
if (tabAt(tab, i) == f) {