HashMap的hash算法
文章摘自:https://blog.csdn.net/a314774167/article/details/100110216
下面是获取put方法中,get方法中获取key的hash值的方法
//重新计算哈希值
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);//key如果是null 新hashcode是0 否则 计算新的hashcode
}
思考:为什么要进行无符号右移16位呢?
首先:什么是无符号右移16位?
按二进制形式把所有的数字向右移动对应位数,低位移出(舍弃),高位的空位补零
所以说原来的hashcode值的高16位,再进行异或操作时会和低16位遇见,目的就是让高16位参与到后续的&运算计算桶位中,减少hash冲突的发生,计算公式:(n - 1) & hash,比如说初始值16的情况下,n-1就是15,15的二进制是0000000000000000001111,如果进行&运算的话,高位都是0,相当于屏蔽了高位。如果我们不做刚才移位异或运算,那么在计算槽位时将丢失高区特征,但是细想当两个哈希码很接近时,那么这高区的一点点差异就可能导致一次哈希碰撞,所以这也是将性能做到极致的一种体现
使用异或的原因:
异或运算能更好的保留各部分的特征,如果采用&运算计算出来的值会向0靠拢,采用|运算计算出来的值会向1靠拢
为什么槽位数要使用2^n呢?
假如槽位用了17
hashcode参加&运算后被更多位的0屏蔽,计算结果只剩下两种0和16,这对于hashmap来说是一种灾难
最终目的还是为了让哈希后的结果更均匀的分部,减少哈希碰撞,提升hashmap的运行效率
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null) //重点是这一行 讲key放在哪一个桶上面
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
算出hash值之后,计算这个key落在哪一个桶上面,方法有2中,一种是&,一种是%,这两种方法都可行,但是效率不一样,请看下面的的测试(抄作业的测试),这个差的还是挺多的,尤其是在map发生扩容的时候,需要重新计算所有key的hash值放到新的hash桶上面,这个时候差别的更大了
,额外记录一点,如果你想取234对8的余数是多少,就可以使用 234&(8-1),余数为2,这个前提a想对b取余时,b必须是2n才能这样玩,还是上面讲过的2n -1的二级制 会全是1,这样,取余的时候,结果就是高位全是0,低位就可以保留下来,保留下来的低位就是余数了