在每个覆盖了equals方法的类中,也必须覆盖hashCode方法。
约定内容:
在应用程序的执行期间,只要对象的equals方法的比较操作所用到的信息没有被修改,那么对这同一个对象调用多次,hashCode方法都必须始终如一地返回同一个整数。在同一个应用程序的多次执行过程中,每次执行所返回的整数可以不一致。
如果两个对象根据equals(Object)方法比较是相等的,那么调用这两个对象中任意一个对象的hashCode方法都必须产生同样的整数结果
如果两个对象根据equals(Object)方法比较是不相等的,那么调用这两个对象中任意一个对象的hashCode方法,则不一定要产生不一样的结果。但是,给不相等的对象产生截然不同的整数结果,有可能提高散列表的性能。
一个好的散列函数通常倾向于“为不相等的对象产生不相等的散列码”。理想情况下,散列函数应该把集合中不相等的实例均匀地分布到所有可能的散列值上。
一种简单的解决办法:
- 把某个非零的常数值,保存在一个名为result的int类型的变量中。
- 对于对象中每个关键域f(指equals方法中涉及的每个域),完成以下步骤:
a. 为该域计算int类型的散列码c:
i. 如果该域是boolean类型,则计算(f ? 1 : 0)。
ii. 如果该域是byte、char、short或者int类型,则计算(int)f。
iii. 如果该域是long类型,则计算(int)(f^(f>>>32)).
iv. 如果该域是float类型,则计算Float.floatToIntBits(f)。
v. 如果该域是double类型,则计算Double.doubleToLongBits(f),然后按照步骤2.a.iii,为得到的long类型值计算散列值。
vi. 如果该域是一个对象引用,并且该类的equals方法通过递归地调用equals的方式来比较这个域,则同样为这个域递归地调用hashCode。如果需要更复杂的比较,则为这个域计算一“范式”,然后针对这个范式调用hashCode。如果这个域的值为null,则返回0(或者其他某个常数,但通常是0)。
vii. 如果该域是一个数组,则要把每个元素当做单独的域来处理。也就是说,递归地应用上述规则,对每个重要的元素计算一个散列码,然后根据步骤2.b中的做法把这些散列值组合起来。如果数据域中的每个元素都很重要,可以利用发行版本1.5中增加的其中一个Array.hashCode方法。
b. 按照下面的公式,把步骤2.a中计算得到的散列码c合并到result中:
result = 31 * result + c;
- 返回result。
- 写完hashCode方法之后,问问自己“相等的实例是否都具有相等的散列码”。要编写单元测试来验证自己的推断。
在散列码计算工程中,可以把冗余域排除在外。如果一个域的值可以根据参与计算的其他域值计算出来,则可以把这样的域排除在外。必须排除equals比较计算中没有用到的任何域,否则很有可能违反hashCode约定的第二条。
如果一个类是不可变的,并且计算散列码的开销也比较大,就应该把散列码缓存在对象内部,而不是每次请求的时候都重新计算散列码。如果这种类型大多数对象会被用散列键,就应该在创建实例的时候计算散列码。
不要试图从散列码计算中排除掉一个对象的关键部分来提高性能。