hashCode和equals是Object的非final方法,它的存在就是用来被重写的。
Object的equals方法如下:
public boolean equals(Object obj) {
return (this == obj);
}
Object的hashCode方法是个native方法。
hashCode返回对象的hash值,主要用户快速查找。在HashMap,HashTable这类散列数据结构中,都是通过hashCode方法查找对象在散列表中的位置。
什么情况下需要重写
equals
Object的equals是用==来判断两个对象是否是同一个对象,及对象地址是否相等。而重写equals为了达到的目的就是实现对象逻辑相等,即值相等。
所以,如果是如下几种情况,不需要重写equals方法:
- 强调活动实体,而不关心值。比如Thread,我们只在乎是哪个线程,不在乎线程的值,所以只需要比较地址就好。
- 不存在逻辑相等。不会用到比较值的功能,所以可以不重写。
- 父类已经重写了equals,子类只需要用父类重写的equals方法即可。
hashCode
如果重写了equals方法,此时必须重写hashCode方法。
为什么?
因为关于hashCode和equals有这样的规范:
- 如果两个对象hashCode相等,对象不一定相等(hash冲突的情况);
- 如果两个对象equals方法返回true,hashCode必相等。
如果我们只重写了equals没有重写hashCode,就可能违反上述第2条规范。违反会造成什么问题呢?在HashMap、HashSet一类散列集合中,会根据对象的hashCode先找对象位置,再根据对象的equals方法判断是否是同一个值。我们存两个equals方法返回true的对象到集合,如果我们没有满足第2条规范,就会导致集合中存在两个相同,但是hashCode不同对象,不是散列集合想达到的目的。
怎么写
equals重写准则
- 自反性:对于任何非空引用值x,x.equals(x)都应该返回true。
- 对称性:对于任何非空引用值x、y,当且仅当x.equals(y)返回true时,y.equals(x)才返回true。
- 传递性:对于任何非空引用值x、y、z,如果x.equals(y)返回true,且y.equals(z)返回true,则x.equals(z)也返回true。
- 一致性:对于任何非空引用值,如果值没有被修改,则无论调用多少次equals方法结果始终相等。
- 非空性:对于任何非空引用值x,x.equals(null)都应该返回false。
equals重写技巧
- 使用==检查参数是否为这个对象的引用:如果是本身,则直接返回,优化性能。
- 使用instanceOf检查参数类型是否正确:如果不是,直接返回false。如果兼容不同类型,很容易违反对称性。
- 将参数类型强制转换为正确的类型:第2步保证了该步不会抛出异常。
- 对于该类中的“关键域”,检查参数中的域是否与对象中的对应域相等:基本类型的域就用==比较,float域用Float.compare方法,double域用Double.compare方法,至于别的引用域,我们一般递归调用它们的equals方法比较,加上判空检查和对自身引用的检查,一般会写成这样:(field == o.field || (field != null && field.equals(o.field))),而上面的String里使用的是数组,所以只要把数组中的每一位拿出来比较就可以了。
- 编写完成后思考是否满足上面提到的对称性,传递性,一致性等等。
hashCode重写技巧
两个目标,一个为不同的目标生成不同的散列值,一个是把实例均匀分布在所有的散列值上。
引自Effective Java
- 把某个非零的常数值,比如17,保存在一个int型的result中;
- 对于每个关键域f(equals方法中设计到的每个域),作以下操作:
(1)为该域计算int类型的散列码:
i.如果该域是boolean类型,则计算(f?1:0),
ii.如果该域是byte,char,short或者int类型,计算(int)f,
iii.如果是long类型,计算(int)(f^(f>>>32)).
iv.如果是float类型,计算Float.floatToIntBits(f).
v.如果是double类型,计算Double.doubleToLongBits(f),然后再计算long型的hash值
vi.如果是对象引用,则递归的调用域的hashCode,如果是更复杂的比较,则需要为这个域计算一个范式,然后针对范式调用hashCode,如果为null,返回0
vii. 如果是一个数组,则把每一个元素当成一个单独的域来处理。
(2)result = 31 * result + c。
★ 为什么采用31result + c,乘法使hash值依赖于域的顺序,如果没有乘法那么所有顺序不同的字符串String对象都会有一样的hash值,而31是一个奇素数,如果是偶数,并且乘法溢出的话,信息会丢失,31有个很好的特性是31i ==(i<<5)-i,即2的5次方减1,虚拟机会优化乘法操作为移位操作的。 - 返回result
- 编写单元测试验证有没有实现所有相等的实例都有相等的散列码。