重写hashcode

最新推荐文章于 2024-05-16 14:35:10 发布

Crazy-xjm

最新推荐文章于 2024-05-16 14:35:10 发布

阅读量5.7k

点赞数 3

文章标签： java

本文链接：https://blog.csdn.net/weixin_44321790/article/details/115090877

版权

hashCode()

1. 何为hashcode？

hashCode() 的作用是获取哈希码，也称为散列码；它实际上是返回一个 int 整数。这个哈希码的作用是确定该对象在哈希表中的索引位置。散列表存储的是键值对(key-value)，它的特点是：能根据“键”快速的检索出对应的“值”。这其中就利用到了散列码！（可以快速找到所需要的对象）。在散列表中 hashCode() 的作用是获取对象的散列码，进而确定该对象在散列表中的位置。

hashCode()定义在 JDK 的 Object 类中，这就意味着 Java 中的任何类都包含有 hashCode() 函数。

另外需要注意的是： Object 的 hashcode 方法是本地方法，也就是用 c 语言或 c++ 实现的，该方法通常用来将对象的内存地址转换为整数之后返回。

public native int hashCode();

下面的代码中，新建了两个等价的对象，并将它们添加到 HashSet 中。我们希望将这两个对象当成一样的，只在集合中添加一个对象，但是因为 EqualExample 没有实现 hasCode() 方法，因此这两个对象的散列值是不同的，最终导致集合添加了两个等价的对象。
如姓名和性别相等就算2个对象相等的话，那么hashcode的方法也要返回姓名的hashcode值加上性别的hashcode值，这样从逻辑上，他们就一致了。

EqualExample e1 = new EqualExample(1, 1, 1);
EqualExample e2 = new EqualExample(1, 1, 1);
System.out.println(e1.equals(e2)); // true
HashSet<EqualExample> set = new HashSet<>();
set.add(e1);
set.add(e2);
System.out.println(set.size());   // 2

2. 为什么要有 hashCode？

hashCode() 返回散列值，而 equals() 是用来判断两个对象是否等价。

等价的两个对象散列值一定相同，但是散列值相同的两个对象不一定等价。

在向hashSet中add()元素时，判断元素是否存在的依据，不仅仅是hash码值就能够确定的，同时还要结合equles方法。

HashSet 如何检查重复：

当你把对象加入 HashSet 时，HashSet 会先计算对象的 hashcode 值来判断对象加入的位置，同时也会与该位置其他已经加入的对象的 hashcode 值作比较，如果没有相符的 hashcode，HashSet 会假设对象没有重复出现。但是如果发现有相同 hashcode 值的对象，这时会调用 equals()方法来检查 hashcode 相等的对象是否真的相同。如果两者相同，HashSet 就不会让其加入操作成功。如果不同的话，就会重新散列到其他位置。这样我们就大大减少了 equals 的次数，相应就大大提高了执行速度。
注：Set里的元素是不能重复的，那么用什么方法来区分重复与否呢? 是用==还是equals()?

Set里的元素是不能重复的，那么用iterator()方法来区分重复与否。equals()是判读两个Set是否相等。

3. 为什么重写 equals 时必须重写hashcode 方法？

如果两个对象相等，则 hashcode 一定也是相同的。两个对象相等,对两个对象分别调用 equals 方法都返回 true。但是，两个对象有相同的 hashcode 值，它们也不一定是相等的。因此，equals 方法被覆盖过，则 hashCode 方法也必须被覆盖，保证等价的两个对象散列值也相等。

hashCode()的默认行为是对堆上的对象产生独特值。如果没有重写 hashCode()，则该 class 的两个对象无论如何都不会相等（即使这两个对象指向相同的数据）

4. 为什么两个对象有相同的 hashcode 值，它们也不一定是相等的？

因为 hashCode() 所使用的杂凑算法也许刚好会让多个对象传回相同的杂凑值。越糟糕的杂凑算法越容易碰撞，但这也与数据值域分布的特性有关（所谓碰撞也就是指的是不同的对象得到相同的 hashCode。

我们刚刚也提到了 HashSet,如果 HashSet 在对比的时候，同样的 hashcode 有多个对象，它会使用 equals() 来判断是否真的相同。也就是说 hashcode 只是用来缩小查找成本。

hashCode()和equals()方法的重要性体现在什么地方

通过hashCode和equals方法保证元素的唯一性，当重写equals方法时，必须重写hashCode方法，因为如果不重写这两个方法，就会默认使用Object的方法，一般是不相同的，所以就会导致存储了重复值，与hashset、hashmap等性质冲突。

5. 重写equals()方法的基本原则

在程序运行时，同一个对象多次调用hashCode()方法应该返回相同的值。
当一个类有自己特有的“逻辑相等”概念，当改写equals()的时候，总是要改写 hash Code（），根据一个类的 equals方法(改写后)，两个截然不同的实例有可能在逻辑上是相等的，但是，根据Object.hashCode()方法，它们仅仅是两个对象。当两个对象的equals()方法比较返回true时，这两个对象的 hashCode()方法的返回值也应相等。
结论：复写equals方法的时候一般都需要同时复写 hashCode方法。通常参与计算 hashCode的对象的属性也应该参与到equals()中进行计算。对象中用作equals()方法比较的Field，都应该用来计算hashCode值。

6. Eclipse/IDEA工具里hashCode()重写

以Eclipse/DEA为例，在自定义类中可以调用工具自动重写equals()和hashCode() 问题：为什么用 Eclipse/IDEA复写 hash Code方法，有31这个数字？

选择系数的时候要选择尽量大的系数。因为如果计算出来的hash地址越大，所谓的“冲突”就越少，查找起来效率也会提高。（减少冲突）
并且31只占用5bits，相乘造成数据溢出的概率较小。
31可以由i*31==(<<5)-1来表示，现在很多虚拟机里面都有做相关优化。（提高算法效率）
31是一个素数，素数作用就是如果我用一个数字来乘以这个素数，那么最终出来的结果只能被素数本身和被乘数还有1来整除！（减少冲突）

代码示例：

@Override
public boolean equals(Object o) {
    System.out.println("User equals()....");
    if (this == o) return true;
    if (o == null || getClass() != o.getClass()) return false;

    User user = (User) o;

    if (age != user.age) return false;
    return name != null ? name.equals(user.name) : user.name == null;
}

@Override
public int hashCode() { //return name.hashCode() + age;
    int result = name != null ? name.hashCode() : 0;
    result = 31 * result + age;
    return result;
}

Crazy-xjm

关注

3
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
重写hashcode

hashCode()1. 何为hashcode？hashCode() 的作用是获取哈希码，也称为散列码；它实际上是返回一个 int 整数。这个哈希码的作用是确定该对象在哈希表中的索引位置。散列表存储的是键值对(key-value)，它的特点是：能根据“键”快速的检索出对应的“值”。这其中就利用到了散列码！（可以快速找到所需要的对象）。在散列表中 hashCode() 的作用是获取对象的散列码，进而确定该对象在散列表中的位置。hashCode()定义在 JDK 的 Object 类中，这就意味着 Jav
复制链接

扫一扫