equals和hashCode方法是java.lang.Object的两个函数。
equals
函数原型:
public boolean equals(Object obj)
指示obj对象是否“等于”该对象。所谓“等于”并不是指必须是相同对象,也可以是不同对象,只要对象内的状态一致就行。但是在Object类中,他的实现是,只要是同一对象就“等于”,关于这一点,之后讨论。
该方法的实现必须要满足等价关系:
- 自反性:对于任何非空引用值
x
,x.equals(x)
都应返回true
。- 对称性:对于任何非空引用值
x
和y
,当且仅当y.equals(x)
返回true
时,x.equals(y)
才应返回true
。- 传递性:对于任何非空引用值
x
、y
和z
,如果x.equals(y)
返回true
,并且y.equals(z)
返回true
,那么x.equals(z)
应返回true
。- 一致性:对于任何非空引用值
x
和y
,多次调用 x.equals(y) 始终返回true
或始终返回false
,前提是对象上equals
比较中所用的信息没有被修改。- 对于任何非空引用值
x
,x.equals(null)
都应返回false
。
等价关系是自反的、对称的、传递的、一致的。我不知道为何需要满足等价关系,或许是“equals”本身的语义关系就满足等价关系。关于等价关系,离散数学中有详细讲解。
先看看Object中对equals函数的实现。
public boolean equals(Object obj) {
return (this == obj);
}
很简单,就是判断两个引用是否指向同一对象。如果是同一对象,那肯定是相等的。
再看看String中的实现,String中的equals重写了equals函数。
public boolean equals(Object anObject) {
if (this == anObject) {//指向同一对象,必定相等
return true;
}
//如果是String或其子类的对象,则进入if语句中。
//注意,如果anObject为null,instanceof会返回false
if (anObject instanceof String) {
//开始对anObject和该String进行逐字节比较,如果相同则返回true;
String anotherString = (String)anObject;
int n = value.length;
if (n == anotherString.value.length) {
char v1[] = value;
char v2[] = anotherString.value;
int i = 0;
while (n-- != 0) {
if (v1[i] != v2[i])
return false;
i++;
}
return true;
}
}
return false;
}
从代码中可以看出,不只是同一对象是相等的,即使不是同一对象,如果表示的字符串相同也是相等的。
每当equals被重写,都需要重写hashCode方法,因为需要维护hashCode的一个原则:“相等”对象必须返回相等的哈希值。
下面看看hashCode的介绍。
hashCode
函数原型:
public int hashCode()
该函数返回一个关于该对象的哈希值。该函数时为了支持哈希表的性能。就是说哈希表中会使用到该函数。
它有一些规定:
- 在 Java 应用程序执行期间,在对同一对象多次调用 hashCode 方法时,必须一致地返回相同的整数,前提是将对象进行 equals 比较时所用的信息没有被修改。从某一应用程序的一次执行到同一应用程序的另一次执行,该整数无需保持一致。
- 如果根据 equals(Object) 方法,两个对象是相等的,那么对这两个对象中的每个对象调用
hashCode
方法都必须生成相同的整数结果。- 如果根据
equals(java.lang.Object)
方法,两个对象不相等,那么对这两个对象中的任一对象上调用 hashCode 方法不 要求一定生成不同的整数结果。但是,程序员应该意识到,为不相等的对象生成不同整数结果可以提高哈希表的性能。
规定指明,被equals函数判断相等的两个对象必须要有一致的哈希值。被判断不相等的两个对象哈希值可以相同,可以不同,但是返回不同的哈希值可以提高哈希表的性能。如果了解哈希表的原理,就该知道为什么哈希值不同,性能会提高。
Object中hashCode的默认实现通常是将对象的地址转换为哈希值。
看看String中对hashCode的实现:
/** Cache the hash code for the string */
private int hash; // Default to 0
//如果该字符串是从其他字符串上构造的,则将该hash值缓存起来。
public String(String original) {
this.value = original.value;
this.hash = original.hash;
}
public int hashCode() {
int h = hash;
//如果h=0,说明不是通过其他字符串构造的,则需要自己计算hash值。
//如果h不为零,则沿用该hash值,我猜缓存hash值是为了提高该函数的效率
//,因此从该hash值的计算方法来看,相同字符串的hash值是一致的。
if (h == 0 && value.length > 0) {
char val[] = value;
for (int i = 0; i < value.length; i++) {
h = 31 * h + val[i];
}
hash = h;
}
return h;
}
从代码中可以看出,相同字符串的哈希值是一致的,因此equals函数返回true时,两个对象的哈希值必定一致。
参考:
https://www.geeksforgeeks.org/equals-hashcode-methods-java/
https://docs.oracle.com/javase/7/docs/api/java/lang/Object.html#equals(java.lang.Object)