背景
在看阿里巴巴Java开发手册手册时,看到了有关hashCode()和equals()方法的使用规范。
只要重写 equals,就必须重写 hashCode。
因为 Set 存储的是不重复的对象,依据 hashCode 和 equals 进行判断,所以 Set 存储的对象必须重写这两个方法。
如果自定义对象做为 Map 的键,那么必须重写 hashCode 和 equals。
并且举了String 重写了 hashCode 和 equals 方法,所以我们可以非常愉快地使用 String 对象作为 key 来使用的例子。
我们看下String的hashCode()和equals()的源码:
String的hashCode()
hashCode():
private int hash; // Default to 0
public int hashCode() {
int h = hash;
if (h == 0 && value.length > 0) {
char val[] = value;
for (int i = 0; i < value.length; i++) {
h = 31 * h + val[i];
}
hash = h;
}
return h;
}
代码就不一行一行的解释了,单纯的从代码角度上来说,我们也可以学到一些知识点。
缓存的重要性,这里的value属性就作为了缓存。
大多数情况下缓存是在使用时生成的。
计算hash时可以用类本身的属性的值与31乘积。
为什么是31,而不是32,33等其他数字呢?
31是一个素数,素数作用就是如果我用一个数字来乘以这个素数,那么最终的出来的结果只能被素数本身和被乘数还有1来整除。
31可以由i*31 == (i<<5)-1来表示,现在很多虚拟机里面都有做相关优化。
选择系数的时候要选择尽量大的系数。因为如果计算出来的hash地址越大,所谓的“冲突”就越少,查找起来效率也会提高。
并且31只占用5bits,相乘造成数据溢出的概率较小。
后面再说hashCode的设计原则,继续介绍equals()方法。
String的equals()
public boolean equals(Object a