java 中hashcode 与 equals的关系

先来看能表明hashcode和equals的关系的几句话:

equals()相等的两个对象,hashcode()一定相等;

equals()不相等的两个对象,却并不能证明他们的hashcode()不相等。

反过来:

hashcode()不等,一定能推出equals()也不等;

hashcode()相等,equals()可能相等,可能不等。

我觉得这样表达两者之间的关系,对程序员来说起不到一点作用,充其量在考试时能做对题目。

我尝试用下边的方法解释两者之间的关系。

 

 

 

        首先,应该知道什么是hash表,假如有:10,11,13,14,18,22,27这几个数字,hash算法的目的就是快速的为每个数字分区,存入相应的分区后,以后找起来能更快速。

        那么假设hash算法对5取余数,那么数字10,余数0,放在0的位置,数字11,余数1,放在1的位置,其余一次类推。结果如上图所示。

       在java中hash算法主要用在集合上,如hashset,hashmap。

        我们都知道set有一个特性,就是可与用于过滤相同值的操作,有点类似与SQL中distinct关键字一样。相同的对象,在第2次add进hashset中,由于两次add的是相同的对象,所以,第二次的add未起作用。

       如果当前set中已经有1万个不同对象了,那么再添加一个对象时,该怎么判断?判断1万次是否已经含有将要添加到set中的值?显然不会那么做。用什么方法比较才能快速的比较出新添加的数据是不是Set中已经有的数据呢?那么这就用到了hashcode。

       再将每一个对象插入hashset之前,首先先算出该对象的hashcode,将要存入hashset的对象只跟具有相同hashcode的元素进行equals比较。此处的hashcode可以对应上图的0,1,2,3,4. 

 

 

       现在依次add3个数字,分别是13,18,27,我们把他们看成3个对象,他们的hashcode都等于3(假设hashcode的算法是数字对5取余的话),所以都应放入3区域,而且他们3个经过equals比较是不相等的,所以3个数字都逐次的存入3区域了。

       假如再add一下18的话,首先算hashcode,等于3,然后去3对应的区域将每个元素都用equals比较一遍,显然已经有18了,所以18不再被添加如hashset。这样通过先算出hashcode,然后将要做比较的范围缩小了(再次添加的18,只需和3区域的13、18、27比较),是不是加快速度了呢?

 

        现在,对照图片我们很容易理解文章开头说的那几句话。

        1.equals()相等的两个对象,hashcode()一定相等;        

                两次添加18,他们是相等的对象,肯定能推出hashcode相等,正因为有了hashcode相等这

                个事实,所以才有了第2次的18被分配到3区域与原来的18比较的机会。

        2.equals()不相等的两个对象,却并不能证明他们的hashcode()不相等。

                对照数字13,18,27。   

               13和18,27是互不相等的对象,但是hashcode却相等

        那么,如果我们的hashcode的算法如果变了呢?比如:我覆盖了Object的hashcode和equals方法,先前的hashcode的算法和我现在hashcode的算法不同时,会出现什么样的情况呢??



在这篇文章中,我将告诉大家我对hashCode和equals方法的理解。我将讨论他们的默认实现,以及如何正确的重写他们。我也将使用Apache Commons提供的工具包做一个实现。 

目录:

  1. hashCode()和equals()的用法
  2. 重写默认实现
  3. 使用Apache Commons Lang包重写hashCode()和equals()
  4. 需要注意记住的事情
  5. 当使用ORM的时候特别要注意的
hashCode()和equals()定义在Object类中,这个类是所有java类的基类,所以所有的java类都继承这两个方法。


使用hashCode()和equals()

hashCode()方法被用来获取给定对象的唯一整数。这个整数被用来确定对象被存储在HashTable类似的结构中的位置。默认的,Object类的hashCode()方法返回这个对象存储的内存地址的编号。

重写默认的实现

如果你不重写这两个方法,将几乎不遇到任何问题,但是有的时候程序要求我们必须改变一些对象的默认实现。

来看看这个例子,让我们创建一个简单的类Employee

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
public class Employee
{
     private Integer id;
     private String firstname;
     private String lastName;
     private String department;
 
     public Integer getId() {
         return id;
     }
     public void setId(Integer id) {
         this .id = id;
     }
     public String getFirstname() {
         return firstname;
     }
     public void setFirstname(String firstname) {
         this .firstname = firstname;
     }
     public String getLastName() {
         return lastName;
     }
     public void setLastName(String lastName) {
         this .lastName = lastName;
     }
     public String getDepartment() {
         return department;
     }
     public void setDepartment(String department) {
         this .department = department;
     }
}
上面的Employee类只是有一些非常基础的属性和getter、setter.现在来考虑一个你需要比较两个employee的情形。


?
1
2
3
4
5
6
7
8
9
10
11
public class EqualsTest {
     public static void main(String[] args) {
         Employee e1 = new Employee();
         Employee e2 = new Employee();
 
         e1.setId( 100 );
         e2.setId( 100 );
         //Prints false in console
         System.out.println(e1.equals(e2));
     }
}
毫无疑问,上面的程序将输出false,但是,事实上上面两个对象代表的是通过一个employee。真正的商业逻辑希望我们返回true。 
为了达到这个目的,我们需要重写equals方法。 
?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
public boolean equals(Object o) {
         if (o == null )
         {
             return false ;
         }
         if (o == this )
         {
            return true ;
         }
         if (getClass() != o.getClass())
         {
             return false ;
         }
         Employee e = (Employee) o;
         return ( this .getId() == e.getId());
}
在上面的类中添加这个方法,EauqlsTest将会输出true。 
So are we done?没有,让我们换一种测试方法来看看。 
?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
import java.util.HashSet;
import java.util.Set;
 
public class EqualsTest
{
     public static void main(String[] args)
     {
         Employee e1 = new Employee();
         Employee e2 = new Employee();
 
         e1.setId( 100 );
         e2.setId( 100 );
 
         //Prints 'true'
         System.out.println(e1.equals(e2));
 
         Set<Employee> employees = new HashSet<Employee>();
         employees.add(e1);
         employees.add(e2);
         //Prints two objects
         System.out.println(employees);
     }
上面的程序输出的结果是两个。如果两个employee对象equals返回true,Set中应该只存储一个对象才对,问题在哪里呢? 
我们忘掉了第二个重要的方法hashCode()。就像JDK的Javadoc中所说的一样,如果重写equals()方法必须要重写hashCode()方法。我们加上下面这个方法,程序将执行正确。
?
1
2
3
4
5
6
7
8
@Override
  public int hashCode()
  {
     final int PRIME = 31 ;
     int result = 1 ;
     result = PRIME * result + getId();
     return result;
  }
使用Apache Commons Lang包重写hashCode() 和equals()方法 
Apache Commons 包提供了两个非常优秀的类来生成hashCode()和equals()方法。看下面的程序。 


?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
import org.apache.commons.lang3.builder.EqualsBuilder;
import org.apache.commons.lang3.builder.HashCodeBuilder;
public class Employee
{
  private Integer id;
  private String firstname;
  private String lastName;
  private String department;
public Integer getId() {
     return id;
  }
  public void setId(Integer id) {
     this .id = id;
  }
  public String getFirstname() {
     return firstname;
  }
  public void setFirstname(String firstname) {
     this .firstname = firstname;
  }
  public String getLastName() {
     return lastName;
  }
  public void setLastName(String lastName) {
     this .lastName = lastName;
  }
  public String getDepartment() {
     return department;
  }
  public void setDepartment(String department) {
     this .department = department;
  }
@Override
  public int hashCode()
  {
     final int PRIME = 31 ;
     return new HashCodeBuilder(getId()% 2 == 0 ?getId()+ 1 :getId(), PRIME).
            toHashCode();
  }
@Override
  public boolean equals(Object o) {
     if (o == null )
        return false ;
     if (o == this )
        return true ;
     if (o.getClass() != getClass())
        return false ;
     Employee e = (Employee) o;
        return new EqualsBuilder().
               append(getId(), e.getId()).
               isEquals();
     }
  }
如果你使用Eclipse或者其他的IDE,IDE也可能会提供生成良好的hashCode()方法和equals()方法。 

需要注意记住的事情

  • 尽量保证使用对象的同一个属性来生成hashCode()和equals()两个方法。在我们的案例中,我们使用员工id。
  • eqauls方法必须保证一致(如果对象没有被修改,equals应该返回相同的值)
  • 任何时候只要a.equals(b),那么a.hashCode()必须和b.hashCode()相等。
  • 两者必须同时重写。
当使用ORM的时候特别要注意的
  • 如果你使用ORM处理一些对象的话,你要确保在hashCode()和equals()对象中使用getter和setter而不是直接引用成员变量。因为在ORM中有的时候成员变量会被延时加载,这些变量只有当getter方法被调用的时候才真正可用。
  • 例如在我们的例子中,如果我们使用e1.id == e2.id则可能会出现这个问题,但是我们使用e1.getId() == e2.getId()就不会出现这个问题。
希望这篇文章能够帮助你。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值