关于hashCode()的一些知识,很早之前还是做了比较系统深入的研究,可惜时间长都忘了,现在再回顾一下吧,也记下来,以备以后的查阅。
为什么设计hashCode()
hashCode()返回的是一个值,我们称之为哈希值,记为hashCode值。他的主要用途是在对对象进行散列的时候作为key值输入,所以,我们的每一个对象的hashCode值需要尽可能的不一样。
JDK对基类Object的hashCode()方法,提供了一个默认的基础对象引用地址的特定算法,来保证每一个对象的hashCode值不一样。
hashCode值和HashSet、HashMap等的关系
这些集合类是通过元素的hashCode值和相应的Hash算法来散列对象的。
比如对HashSet而言,存入元素的流程为:
获取hashCode值,经过hash算法,找到对象应该存放的位置。如果位置为空,将对象放入该位置;如果位置不为空,使用equals()方法比较两个对象,如果返回true,不再插入,如果返回false,根据hash冲突解决算法将对象存入其他位置。
测试代码:
import java.util.HashSet;
import java.util.Set;
public class HashCodeTest {
public static void main(String[] args) {
Set<MyClass> set = new HashSet<MyClass>();
MyClass class1 = new MyClass();
MyClass class2 = new MyClass();
System.out.println(class1.hashCode());
System.out.println(class2.hashCode());
set.add(class1);
set.add(class2);
System.out.println(set.size());
}
}
class MyClass {
@Override
public int hashCode() {
return 1;
}
@Override
public boolean equals(Object obj) {
return false;
}
}
通过修改MyClass.equals()方法的返回结果,我们可以看到,在hashCode值一样的情况下,set.size()不一样。
为什么重写了equals()方法就必须重写hashCode()方法呢?
这个问题很重要!!!!!!
看过String源码的人会发现,String重写了Object的equals()和hashCode()两个方法,当String的equals为true的时候,hashCode值相等。
那为什么这么做呢?
Object规范说了:
如果两个对象调用equals()方法相等,那么这两个对象的hashCode()返回的结果也必须相等。
是不是对这些规范了什么的不感冒呢,哈哈,还是从例子出发吧。
比如有很多个学生对象,规定学号相同的学生为同一个学生,所以重写了equals()方法;当把这些对象全部放入HashSet集合的时候,有两个学生对象的学号相同,执行了add()方法之后,发现集合HashSet依然存在这两个对象,这与我们的期望就不一致了。那怎么办呢?重写hashCode()被,保证equals的两个对象的hashCode值一样就OK了。
怎么重写hashCode()方法呢?
首先要保证equals的对象hashCode值一样;
其次,对不equals的对象要尽量保证hashCode值不同
下面介绍一种可参考的实现算法步骤:
1、定义一个返回值 int result=17(这个值一般取素数);
2、为对象中每一个有意义的属性值(参与equals()方法比较的域)算出一个散列码;
3、合并
4、返回结果result即可。
关于每一个域的散列码的获取规律:
- boolean型,计算(f ? 0 : 1);
- byte,char,short型,计算(int)f;
- long型,计算(int) (f ^ (f>>>32));
- float型,计算Float.floatToIntBits(afloat);
- double型,计算Double.doubleToLongBits(adouble)得到一个long,再执行[2.3];
- 对象引用,递归调用它的hashCode方法;
- 数组域,对其中每个元素调用它的hashCode方法。
代码例子:
@Override
public int hashCode() {
int result = 17;
result = 31*result + no;
result = 31*result + name.hashCode();
result = 31*result + age;
return result;
}
如果hashCode计算 的开销比较大,并且这个对象是不可变的,应该考虑把这个值缓存在对象内部,代码如下:
private volatile int hashCode;
@Override
public int hashCode() {
int result = hashCode;
if(result==0) {
result = 17;
result = 31*result + no;
result = 31*result + name.hashCode();
result = 31*result + age;
}
return result;
}
String类型的HashCode
String类型的HashCode比较特殊,是通过每一个字符转化为int类型计算出来的,所以,相同内容的String类型的HashCode相同,不管是new String("abc")方式还是"abc"方式。
其他类型的HashCode
其他类型的HashCode默认获取的是native方法的HashCode值,不相同。