先来看能表明hashcode和equals的关系的几句话:
equals()相等的两个对象,hashcode()一定相等;
equals()不相等的两个对象,却并不能证明他们的hashcode()不相等。
反过来:
hashcode()不等,一定能推出equals()也不等;
hashcode()相等,equals()可能相等,也可能不等。
我觉得这样表达两者之间的关系,对程序员来说起不到一点作用,充其量在考试时能做对题目。
我尝试用下边的方法解释两者之间的关系。
首先,应该知道什么是hash表,假如有:10,11,13,14,18,22,27这几个数字,hash算法的目的就是快速的为每个数字分区,存入相应的分区后,以后找起来能更快速。
那么假设hash算法对5取余数,那么数字10,余数0,放在0的位置,数字11,余数1,放在1的位置,其余一次类推。结果如上图所示。
在java中hash算法主要用在集合上,如hashset,hashmap。
我们都知道set有一个特性,就是可与用于过滤相同值的操作,有点类似与SQL中distinct关键字一样。相同的对象,在第2次add进hashset中,由于两次add的是相同的对象,所以,第二次的add未起作用。
如果当前set中已经有1万个不同对象了,那么再添加一个对象时,该怎么判断?判断1万次是否已经含有将要添加到set中的值?显然不会那么做。用什么方法比较才能快速的比较出新添加的数据是不是Set中已经有的数据呢?那么这就用到了hashcode。
再将每一个对象插入hashset之前,首先先算出该对象的hashcode,将要存入hashset的对象只跟具有相同hashcode的元素进行equals比较。此处的hashcode可以对应上图的0,1,2,3,4.
现在依次add3个数字,分别是13,18,27,我们把他们看成3个对象,他们的hashcode都等于3(假设hashcode的算法是数字对5取余的话),所以都应放入3区域,而且他们3个经过equals比较是不相等的,所以3个数字都逐次的存入3区域了。
假如再add一下18的话,首先算hashcode,等于3,然后去3对应的区域将每个元素都用equals比较一遍,显然已经有18了,所以18不再被添加如hashset。这样通过先算出hashcode,然后将要做比较的范围缩小了(再次添加的18,只需和3区域的13、18、27比较),是不是加快速度了呢?
现在,对照图片我们很容易理解文章开头说的那几句话。
1.equals()相等的两个对象,hashcode()一定相等;
两次添加18,他们是相等的对象,肯定能推出hashcode相等,正因为有了hashcode相等这
个事实,所以才有了第2次的18被分配到3区域与原来的18比较的机会。
2.equals()不相等的两个对象,却并不能证明他们的hashcode()不相等。
对照数字13,18,27。
13和18,27是互不相等的对象,但是hashcode却相等
那么,如果我们的hashcode的算法如果变了呢?比如:我覆盖了Object的hashcode和equals方法,先前的hashcode的算法和我现在hashcode的算法不同时,会出现什么样的情况呢??
在这篇文章中,我将告诉大家我对hashCode和equals方法的理解。我将讨论他们的默认实现,以及如何正确的重写他们。我也将使用Apache Commons提供的工具包做一个实现。
目录:
- hashCode()和equals()的用法
- 重写默认实现
- 使用Apache Commons Lang包重写hashCode()和equals()
- 需要注意记住的事情
- 当使用ORM的时候特别要注意的
使用hashCode()和equals()
hashCode()方法被用来获取给定对象的唯一整数。这个整数被用来确定对象被存储在HashTable类似的结构中的位置。默认的,Object类的hashCode()方法返回这个对象存储的内存地址的编号。
重写默认的实现
如果你不重写这两个方法,将几乎不遇到任何问题,但是有的时候程序要求我们必须改变一些对象的默认实现。
来看看这个例子,让我们创建一个简单的类Employee
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
|
public
class
Employee
{
private
Integer id;
private
String firstname;
private
String lastName;
private
String department;
public
Integer getId() {
return
id;
}
public
void
setId(Integer id) {
this
.id = id;
}
public
String getFirstname() {
return
firstname;
}
public
void
setFirstname(String firstname) {
this
.firstname = firstname;
}
public
String getLastName() {
return
lastName;
}
public
void
setLastName(String lastName) {
this
.lastName = lastName;
}
public
String getDepartment() {
return
department;
}
public
void
setDepartment(String department) {
this
.department = department;
}
}
|
1
2
3
4
5
6
7
8
9
10
11
|
public
class
EqualsTest {
public
static
void
main(String[] args) {
Employee e1 =
new
Employee();
Employee e2 =
new
Employee();
e1.setId(
100
);
e2.setId(
100
);
//Prints false in console
System.out.println(e1.equals(e2));
}
}
|
为了达到这个目的,我们需要重写equals方法。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
public
boolean
equals(Object o) {
if
(o ==
null
)
{
return
false
;
}
if
(o ==
this
)
{
return
true
;
}
if
(getClass() != o.getClass())
{
return
false
;
}
Employee e = (Employee) o;
return
(
this
.getId() == e.getId());
}
|
So are we done?没有,让我们换一种测试方法来看看。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
|
import
java.util.HashSet;
import
java.util.Set;
public
class
EqualsTest
{
public
static
void
main(String[] args)
{
Employee e1 =
new
Employee();
Employee e2 =
new
Employee();
e1.setId(
100
);
e2.setId(
100
);
//Prints 'true'
System.out.println(e1.equals(e2));
Set<Employee> employees =
new
HashSet<Employee>();
employees.add(e1);
employees.add(e2);
//Prints two objects
System.out.println(employees);
}
|
我们忘掉了第二个重要的方法hashCode()。就像JDK的Javadoc中所说的一样,如果重写equals()方法必须要重写hashCode()方法。我们加上下面这个方法,程序将执行正确。
1
2
3
4
5
6
7
8
|
@Override
public
int
hashCode()
{
final
int
PRIME =
31
;
int
result =
1
;
result = PRIME * result + getId();
return
result;
}
|
Apache Commons 包提供了两个非常优秀的类来生成hashCode()和equals()方法。看下面的程序。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
|
import
org.apache.commons.lang3.builder.EqualsBuilder;
import
org.apache.commons.lang3.builder.HashCodeBuilder;
public
class
Employee
{
private
Integer id;
private
String firstname;
private
String lastName;
private
String department;
public
Integer getId() {
return
id;
}
public
void
setId(Integer id) {
this
.id = id;
}
public
String getFirstname() {
return
firstname;
}
public
void
setFirstname(String firstname) {
this
.firstname = firstname;
}
public
String getLastName() {
return
lastName;
}
public
void
setLastName(String lastName) {
this
.lastName = lastName;
}
public
String getDepartment() {
return
department;
}
public
void
setDepartment(String department) {
this
.department = department;
}
@Override
public
int
hashCode()
{
final
int
PRIME =
31
;
return
new
HashCodeBuilder(getId()%
2
==
0
?getId()+
1
:getId(), PRIME).
toHashCode();
}
@Override
public
boolean
equals(Object o) {
if
(o ==
null
)
return
false
;
if
(o ==
this
)
return
true
;
if
(o.getClass() != getClass())
return
false
;
Employee e = (Employee) o;
return
new
EqualsBuilder().
append(getId(), e.getId()).
isEquals();
}
}
|
需要注意记住的事情
- 尽量保证使用对象的同一个属性来生成hashCode()和equals()两个方法。在我们的案例中,我们使用员工id。
- eqauls方法必须保证一致(如果对象没有被修改,equals应该返回相同的值)
- 任何时候只要a.equals(b),那么a.hashCode()必须和b.hashCode()相等。
- 两者必须同时重写。
- 如果你使用ORM处理一些对象的话,你要确保在hashCode()和equals()对象中使用getter和setter而不是直接引用成员变量。因为在ORM中有的时候成员变量会被延时加载,这些变量只有当getter方法被调用的时候才真正可用。
- 例如在我们的例子中,如果我们使用e1.id == e2.id则可能会出现这个问题,但是我们使用e1.getId() == e2.getId()就不会出现这个问题。