写了很久的代码,每个实体一般都要重写equals 和 hashcode 方法,关于为何重写,上一篇已经初步进行了介绍。
但是看过源码的人一定会很奇怪,String类的hashcode的实现方法。
public int hashCode() {
int h = hash; //构造函数字符串hash 默认0
if (h == 0 && value.length > 0) {
char val[] = value; //构造函数字符串值
for (int i = 0; i < value.length ; i++) {
h = 31*h + val[i];
}
hash = h;
}
return h;
}
为什么要这样实现,以及31是什么鬼?
先说原因:性能高。
至于为啥性能高?
1.我们知道,比较、查找对象第一步就是hashcode,而最好的实现方式就是没有哈希冲突,实现O(1)的复杂度
2.而怎样才能实现最少的哈希冲突呢?
我们看代码
hashcode = s[0]*31^(n-1)+s[1]*31^(n-2)+...+s[n-1]*32^0 的多项式
这个31就很关键。
关键词 :
计算机计算移位操作(乘2即地址单元一个移位操作,快)、
素数:素数在使用的时候有一个作用就是如果我用一个数字来乘以这个素数,那么最终的出来的结果只能被素数本身和被乘数还有1来整除
在存储数据计算hash地址的时候,我们希望尽量减少有同样的hash地址,所谓“冲突”。
31是个神奇的数字,因为任何数n * 31就可以被JVM优化为 (n << 5) -n,移位和减法的操作效率要比乘法的操作效率高的多,对左移现在很多虚拟机里面都有做相关优化,并且31只占用5bits!
因此:该方法能提高计算速度,减少哈希冲突,顺道减小计算时的内存占用!!