为什么要重写hashCode()和equals()&Set集合

最新推荐文章于 2022-05-17 21:31:18 发布

Liz_Coder

最新推荐文章于 2022-05-17 21:31:18 发布

阅读量629

点赞数 9

分类专栏：集合框架文章标签： java hash

原文链接：https://blog.csdn.net/Dome_/article/details/92084823

版权

集合框架专栏收录该内容

2 篇文章 0 订阅

订阅专栏

在Set接口，Map接口中，每一个储存到哈希表中的对象都要重写hashCode()方法和equals方法

在了解为什么要重写hashCode()和equals()方法之前我们先了解一下

一、什么是hash 、hash表

简单说

hash是一个函数，通过一系列的算法得到的值称为—— hashcode
hash表(哈希表)则储存由该hash函数计算得出的所有hash值

二、什么是hashcode

理解完hash后就很简单了，hashcode就是通过hash函数计算出的值

在JAVA中，每个对象的hashcode值决定了在哈希表中的存储位置

这里说的对象在hash表中的地址跟对象的物理地址（对象在内存中的地址）是完全不同的概念

而对象中的hashcode怎么来的呢

在顶级父类Object中，存在hashCode()方法，被native关键字修饰，说明该方法为原生函数——内部使用c / c++实现
在这里插入图片描述
当对象调用Object类中的hashCode()方法时，JVM通过调用原生函数计算得出该对象的hashcode值

Student s1 = new Student();
Student s2 = new Student();
Student s3 = new Student();

s1.hashCode();    // 557041912
s2.hashCode();    // 113471290
s3.hashCode();    // 985922955

对于任意两个不同的对象，其hash值相同的可能性极其小

这就体现了其优势：查询的快捷性 (用hashcode来代表对象在hash表中的位置）

以HashSet为例，根据对象的hashCode方法计算出该对象的hashcode，可以快速地找到要进行操作的对象位置。

三、Set接口的特征及其子类HashSet

Set接口存储特点：——储存引用类型

不允许元素重复
不会记录元素的添加先后顺序

HashSet为Set接口的实现类

HashSet底层采用哈希表实现，元素对象的hashCode值决定了在哈希表中的存储位置

其基本原理是：使用一个下标范围很大的数组来存储对象。通过一个函数，根据每个对象的信息计算得到一个函数值（即数组下标，hashcode），然后该单元数组来存储这个对象

每一个存储到哈希表中的对象，都得覆盖hashCode和equals方法用来判断是否是同一个对象

对象的hash算法是怎么计算，怎么判断的？

如果成员变量是基本数据类型，则根据变量数据参加计算后判断
如果成员变量是引用数据类型，则获得成员变量的哈希码值(原生函数)后，再参数计算后判断

当往HashSet集合中添加新的元素对象时，先会判断该对象和集合对象中的hashCode值：

不等: 直接把该新的对象存储到hashCode指定的位置
相等: 再继续判断新对象和集合对象中的equals做比较
1. 若equals为true：则视为是同一个对象，则不保存。
2. 若equals为false：存储在之前对象同槽位的链表上 —— 哈希碰撞

这里简单概括下什么是哈希碰撞 —— 哈希冲突

当添加元素时，在判断hashCode相等的情况下的情况下，再判断equals，如果返回值为false，则这个时候会以链表的形式在同一个位置上存放两个元素，这会使得HashSet的性能降低，因为不能快速定位了
在这里插入图片描述

四、为什么重写equals()方法后也要重写hashCode()方法

我们在定义类时，想要把它的实例保存在Set集合中时，按照原则，我们需要重写了equals()方法和hashCode()方法

hashCode()的作用就是获取哈希码 (hashCode)，也称为散列码，这个哈希码的作用是确定该对象在哈希表中的索引位置

这里小伙伴就会带有疑问了？

为什么重写equals()方法后也要重写hashCode()方法

这里我们先了解一些hashCode()与equals()之间的规定

如果两个对象相等，则 hashcode 一定也是相同的
两个对象相等,对两个对象分别调用 equals 方法都返回 true
两个对象有相同的 hashcode 值，它们也不一定是相等的

首先我们定义一个Student类，假设只重写了equals()方法，没有重写hashCode()方法

public class Student {
    private String name;
    //有参构造器
    public Student(String name){
        this.name = name;
    }

    //重写equals方法
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        Student student = (Student) o;
        return Objects.equals(name, student.name);
    }
    
    public static void main(String[] args) {
        Student s1 = new Student("张三");
        Student s2 = new Student("张三");
        System.out.println(s1.hashCode());  // 2083562754
        System.out.println(s2.hashCode());  // 1239731077
        System.out.println(s1.equals(s2));  // true
        //创建HashSet集合
        Set stus = new HashSet<Student>();
        stus.add(s1);    //添加成功
        stus.add(s2);    //添加成功
    }
}

从结果可以看出，重写后的equals()方法，在判断s1，s2的内容之后返回true

在一般情况下，我们会希望s1，s2的成员变量值相同时就认为他们相同，我们就会重写equals()方法

我们期望的是当s1，s2对象内容相等时，不进行add添加操作，而往Set集合里添加s2时，会先判断s1和s2中的hashCode值，这里hashCode值不等，直接把 s2对象 存储到hashCode指定的位置，这就不符合我们的期望

所以我们要重写hashCode()方法，来维护HashCode规定——（两个对象相等其哈希值一定相等）再看看结果

 <font size = 5>这时就说明了重写hashCode()的重要性</font>
public class Student {
    private String name;
    //有参构造器
    public Student(String name){
        this.name = name;
    }

    //重写equals方法
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        Student student = (Student) o;
        return Objects.equals(name, student.name);
    }

    //重写hashCode方法
    public int hashCode() {
        return Objects.hash(name);
    }

    public static void main(String[] args) {
        Student s1 = new Student("张三");
        Student s2 = new Student("张三");
        System.out.println(s1.hashCode());  // 774920
        System.out.println(s2.hashCode());  // 774920
        System.out.println(s1.equals(s2));  // true
        //创建HashSet集合
        Set stus = new HashSet<Student>();
        stus.add(s1);    //添加成功
        stus.add(s2);    //添加失败
    }
}

这里s2添加操作失败，add()方法返回false

这下就符合我们的要求了

~~~小小扩展

在我了解HashMap的常用方法时，我看到了这个

在这里插入图片描述

HashSet不是Collection的子类吗，怎么底层却是用HashMap实现

是因为HashSet不允许有重复值和HashMap不允许有重复key值吗？

难道HashMap才是HashSet的爸爸？

于是我上网找了下资料HashSet实现原理

在这里插入图片描述

大概意思就是

HashSet底层采用哈希表HashTable实现，在HashSet中，元素都存到HashMap键值对 (Entry) 的Key，而Key值对应的Value值是一个统一的值

private static final Object PRESENT = new Object();

定义一个最终静态的Object对象作为HashMap中的所有value的值

说到底，HashSet应该是一个被削弱版的HashMap

好了，讲解的知识点到这，如有不对，还请大佬高抬贵手为小弟指点指点
在这里插入图片描述

在这里插入图片描述

Liz_Coder

关注

9
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
为什么要重写hashCode()和equals()&Set集合

在了解为什么要重写hashCode()和equals()方法前我们先了解一、什么是hash 、hash表简单说hash是一个函数，通过一系列的算法得到的值称为—— hashcodehash表(哈希表)则储存由该hash函数计算得出的所有hash值二、什么是hashcode理解完hash后就很简单了，hashcode就是通过hash函数计算出的值在JAVA中，每个对象的hashcode值决定了在哈希表中的存储位置这里说的对象在hash表中的地址不是对象的物理地址（对象存放在内存中
复制链接

扫一扫