hashCode方法和equals方法之间的关系:
equals方法指示其他一个对象和此对象是否相等。在Object类中定义如下:
public boolean equals(Object obj) {
return (this == obj);
}
也就是当x和y引用同一个对象时此方法才返回true。
hashCode方法在Object类中声明如下:
public native int hashCode();
其中native关键字表示java代码引用非java接口。"A native method is a Java method whose implementation is provided by non-java code."
hashCode方法会根据不同的对象返回不同的整数,一般是通过把对象的地址转换成一个整数来实现。
当重写equals方法的时候常常需要重写hashCode方法来维护约定:相等的对象必须具有相等的哈希码。
- 如果x.equals(y)返回“true”,那么x和y的hashCode()必须相等;
- 如果x.equals(y)返回“false”,那么x和y的hashCode()有可能相等,也有可能不等。
如何重写hashCode方法:
Google首席Java架构师Joshua Bloch在他的著作《Effective Java》中提出了一种简单通用的hashCode算法:
1. 初始化一个整形变量,为此变量赋予一个非零的常数值,比如int result = 17;
2. 选取equals方法中用于比较的所有域,然后针对每个域的属性进行计算:
(1) 如果是boolean值,则计算f ? 1:0;
(2) 如果是byte\char\short\int,则计算(int)f;
(3) 如果是long值,则计算(int)(f ^ (f >>> 32));
(4) 如果是float值,则计算Float.floatToIntBits(f);
(5) 如果是double值,则计算Double.doubleToLongBits(f),然后返回的结果是long,再用规则(3)去处理long,得到int;
(6) 如果是对象应用,如果equals方法中采取递归调用的比较方式,那么hashCode中同样采取递归调用hashCode的方式。否则需要为这个域计算一个范式,比如当这个域的值为null的时候,那么hashCode值为0;
(7) 如果是数组,那么需要为每个元素当做单独的域来处理。如果你使用的是1.5及以上版本的JDK,那么没必要自己去重新遍历一遍数组,java.util.Arrays.hashCode方法包含了8种基本类型数组和引用数组的hashCode计算,算法同上,
java.util.Arrays.hashCode(long[])的具体实现:
public static int hashCode(long a[]) {
if (a == null)
return 0;
int result = 1;
for (long element : a) {
int elementHash = (int)(element ^ (element >>> 32));
result = 31 * result + elementHash;
}
return result;
}
Arrays.hashCode(...)只会计算一维数组元素的hashCOde,如果是多维数组,那么需要递归进行hashCode的计算,那么就需要使用Arrays.deepHashCode(Object[])方法。
3. 最后,要如同上面的代码,把每个域的散列码合并到result当中:result = 31 * result + elementHash;
4. 测试,hashCode方法是否符合文章开头说的基本原则,这些基本原则虽然不能保证性能,但是可以保证不出错。
如何重写equals方法:
从HashMap的Node内部类里提取出equals方法的重写模板如下:
public boolean equals(Object o){
if(this == o)
return true;
if(o instanceof XXX){
//强转后比较
}
return false;
}
注意"相等"是一个等价关系,因此你的实现要满足自反性、对称性和传递性。 另外JDK还要求equals的返回具有一致性,即对于非空引用值x和y,多次调用x.equals(y)始终返回true或始终返回false,前提是对象上equals比较中所用的信息没有被修改。另外,任何非空引用x,x.equals(null)都将返回false。