hashCode和equals

本文探讨了何时需要重写hashCode和equals方法,以及如何正确重写这两个方法。重写equals主要是为了实现逻辑相等,而重写hashCode则遵循特定规范,确保与equals的一致性。在HashMap等散列数据结构中,hashCode用于快速定位对象。文章详细介绍了equals的重写准则和技巧,以及hashCode的生成策略,强调了重写过程中的注意事项和测试验证的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

hashCode和equals是Object的非final方法,它的存在就是用来被重写的。
Object的equals方法如下:

public boolean equals(Object obj) {
	  return (this == obj);
}

Object的hashCode方法是个native方法。
hashCode返回对象的hash值,主要用户快速查找。在HashMap,HashTable这类散列数据结构中,都是通过hashCode方法查找对象在散列表中的位置。

什么情况下需要重写

equals

Object的equals是用==来判断两个对象是否是同一个对象,及对象地址是否相等。而重写equals为了达到的目的就是实现对象逻辑相等,即值相等
所以,如果是如下几种情况,不需要重写equals方法:

  1. 强调活动实体,而不关心值。比如Thread,我们只在乎是哪个线程,不在乎线程的值,所以只需要比较地址就好。
  2. 不存在逻辑相等。不会用到比较值的功能,所以可以不重写。
  3. 父类已经重写了equals,子类只需要用父类重写的equals方法即可。

hashCode

如果重写了equals方法,此时必须重写hashCode方法。
为什么?
因为关于hashCode和equals有这样的规范:

  1. 如果两个对象hashCode相等,对象不一定相等(hash冲突的情况);
  2. 如果两个对象equals方法返回true,hashCode必相等。

如果我们只重写了equals没有重写hashCode,就可能违反上述第2条规范。违反会造成什么问题呢?在HashMap、HashSet一类散列集合中,会根据对象的hashCode先找对象位置,再根据对象的equals方法判断是否是同一个值。我们存两个equals方法返回true的对象到集合,如果我们没有满足第2条规范,就会导致集合中存在两个相同,但是hashCode不同对象,不是散列集合想达到的目的。

怎么写

equals重写准则

  1. 自反性:对于任何非空引用值x,x.equals(x)都应该返回true。
  2. 对称性:对于任何非空引用值x、y,当且仅当x.equals(y)返回true时,y.equals(x)才返回true。
  3. 传递性:对于任何非空引用值x、y、z,如果x.equals(y)返回true,且y.equals(z)返回true,则x.equals(z)也返回true。
  4. 一致性:对于任何非空引用值,如果值没有被修改,则无论调用多少次equals方法结果始终相等。
  5. 非空性:对于任何非空引用值x,x.equals(null)都应该返回false。

equals重写技巧

  1. 使用==检查参数是否为这个对象的引用:如果是本身,则直接返回,优化性能。
  2. 使用instanceOf检查参数类型是否正确:如果不是,直接返回false。如果兼容不同类型,很容易违反对称性。
  3. 将参数类型强制转换为正确的类型:第2步保证了该步不会抛出异常。
  4. 对于该类中的“关键域”,检查参数中的域是否与对象中的对应域相等:基本类型的域就用==比较,float域用Float.compare方法,double域用Double.compare方法,至于别的引用域,我们一般递归调用它们的equals方法比较,加上判空检查和对自身引用的检查,一般会写成这样:(field == o.field || (field != null && field.equals(o.field))),而上面的String里使用的是数组,所以只要把数组中的每一位拿出来比较就可以了。
  5. 编写完成后思考是否满足上面提到的对称性,传递性,一致性等等。

hashCode重写技巧

两个目标,一个为不同的目标生成不同的散列值,一个是把实例均匀分布在所有的散列值上。

引自Effective Java
  1. 把某个非零的常数值,比如17,保存在一个int型的result中;
  2. 对于每个关键域f(equals方法中设计到的每个域),作以下操作:
    (1)为该域计算int类型的散列码:
    i.如果该域是boolean类型,则计算(f?1:0),
    ii.如果该域是byte,char,short或者int类型,计算(int)f,
    iii.如果是long类型,计算(int)(f^(f>>>32)).
    iv.如果是float类型,计算Float.floatToIntBits(f).
    v.如果是double类型,计算Double.doubleToLongBits(f),然后再计算long型的hash值
    vi.如果是对象引用,则递归的调用域的hashCode,如果是更复杂的比较,则需要为这个域计算一个范式,然后针对范式调用hashCode,如果为null,返回0
    vii. 如果是一个数组,则把每一个元素当成一个单独的域来处理。
    (2)result = 31 * result + c。
    ★ 为什么采用31result + c,乘法使hash值依赖于域的顺序,如果没有乘法那么所有顺序不同的字符串String对象都会有一样的hash值,而31是一个奇素数,如果是偶数,并且乘法溢出的话,信息会丢失,31有个很好的特性是31i ==(i<<5)-i,即2的5次方减1,虚拟机会优化乘法操作为移位操作的。
  3. 返回result
  4. 编写单元测试验证有没有实现所有相等的实例都有相等的散列码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值