为什么要重写hashCode()和equals()&Set集合

在Set接口,Map接口中,每一个储存到哈希表中的对象都要重写hashCode()方法和equals方法

在了解为什么要重写hashCode()和equals()方法之前我们先了解一下

一 、什么是hash 、hash表

简单说

  • hash是一个函数,通过一系列的算法得到的值称为—— hashcode
  • hash表(哈希表)则储存由该hash函数计算得出的所有hash值

二 、什么是hashcode

理解完hash后就很简单了,hashcode就是通过hash函数计算出的值

在JAVA中,每个对象的hashcode值决定了在哈希表中的存储位置

这里说的对象在hash表中的地址 跟 对象的物理地址(对象在内存中的地址)是完全不同的概念

而对象中的hashcode怎么来的呢

在顶级父类Object中,存在hashCode()方法,被native关键字修饰,说明该方法为原生函数——内部使用c / c++实现
在这里插入图片描述
当对象调用Object类中的hashCode()方法时,JVM通过调用原生函数计算得出该对象的hashcode值

Student s1 = new Student();
Student s2 = new Student();
Student s3 = new Student();

s1.hashCode();    // 557041912
s2.hashCode();    // 113471290
s3.hashCode();    // 985922955

对于任意两个不同的对象,其hash值相同的可能性极其小

这就体现了其优势:查询的快捷性 (用hashcode来代表对象在hash表中的位置

以HashSet为例,根据对象的hashCode方法计算出该对象的hashcode,可以快速地找到要进行操作的对象位置。

三、Set接口的特征及其子类HashSet

Set接口存储特点:——储存引用类型

  • 不允许元素重复
  • 不会记录元素的添加先后顺序

HashSet为Set接口的实现类

HashSet底层采用哈希表实现,元素对象的hashCode值决定了在哈希表中的存储位置

其基本原理是:使用一个下标范围很大的数组来存储对象。通过一个函数,根据每个对象的信息计算得到一个函数值(即数组下标,hashcode),然后该单元数组来存储这个对象

每一个存储到哈希表中的对象,都得覆盖hashCode和equals方法用来判断是否是同一个对象

对象的hash算法是怎么计算,怎么判断的?

  • 如果成员变量是基本数据类型,则根据变量数据参加计算后判断
  • 如果成员变量是引用数据类型,则获得成员变量的哈希码值(原生函数)后,再参数计算后判断

    在这里插入图片描述

当往HashSet集合中添加新的元素对象时,先会判断该对象和集合对象中的hashCode值:

  • 不等: 直接把该新的对象存储到hashCode指定的位置

  • 相等: 再继续判断新对象和集合对象中的equals做比较

    1. 若equals为true:则视为是同一个对象,则不保存。
    2. 若equals为false:存储在之前对象同槽位的链表上 —— 哈希碰撞

    在这里插入图片描述

这里简单概括下什么是哈希碰撞 —— 哈希冲突

当添加元素时,在判断hashCode相等的情况下的情况下,再判断equals,如果返回值为false,则这个时候会以链表的形式在同一个位置上存放两个元素,这会使得HashSet的性能降低,因为不能快速定位了
在这里插入图片描述

四、为什么重写equals()方法后也要重写hashCode()方法

我们在定义类时,想要把它的实例保存在Set集合中时,按照原则,我们需要重写了equals()方法和hashCode()方法

hashCode()的作用就是获取哈希码 (hashCode),也称为散列码,这个哈希码的作用是确定该对象在哈希表中的索引位置

这里小伙伴就会带有疑问了?

为什么重写equals()方法后也要重写hashCode()方法

这里我们先了解一些hashCode()与equals()之间的规定

  1. 如果两个对象相等,则 hashcode 一定也是相同的
  2. 两个对象相等,对两个对象分别调用 equals 方法都返回 true
  3. 两个对象有相同的 hashcode 值,它们也不一定是相等的

首先我们定义一个Student类,假设只重写了equals()方法,没有重写hashCode()方法

public class Student {
    private String name;
    //有参构造器
    public Student(String name){
        this.name = name;
    }

    //重写equals方法
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        Student student = (Student) o;
        return Objects.equals(name, student.name);
    }
    
    public static void main(String[] args) {
        Student s1 = new Student("张三");
        Student s2 = new Student("张三");
        System.out.println(s1.hashCode());  // 2083562754
        System.out.println(s2.hashCode());  // 1239731077
        System.out.println(s1.equals(s2));  // true
        //创建HashSet集合
        Set stus = new HashSet<Student>();
        stus.add(s1);    //添加成功
        stus.add(s2);    //添加成功
    }
}

从结果可以看出,重写后的equals()方法,在判断s1,s2的内容之后返回true

在一般情况下,我们会希望s1,s2的成员变量值相同时就认为他们相同,我们就会重写equals()方法

我们期望的是当s1,s2对象内容相等时,不进行add添加操作,而往Set集合里添加s2时,会先判断s1和s2中的hashCode值,这里hashCode值不等,直接把 s2对象 存储到hashCode指定的位置,这就不符合我们的期望

所以我们要重写hashCode()方法,来维护HashCode规定——(两个对象相等其哈希值一定相等)再看看结果

 <font size = 5>这时就说明了重写hashCode()的重要性</font>
public class Student {
    private String name;
    //有参构造器
    public Student(String name){
        this.name = name;
    }

    //重写equals方法
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        Student student = (Student) o;
        return Objects.equals(name, student.name);
    }

    //重写hashCode方法
    public int hashCode() {
        return Objects.hash(name);
    }

    public static void main(String[] args) {
        Student s1 = new Student("张三");
        Student s2 = new Student("张三");
        System.out.println(s1.hashCode());  // 774920
        System.out.println(s2.hashCode());  // 774920
        System.out.println(s1.equals(s2));  // true
        //创建HashSet集合
        Set stus = new HashSet<Student>();
        stus.add(s1);    //添加成功
        stus.add(s2);    //添加失败
    }
}

这里s2添加操作失败,add()方法返回false

这下就符合我们的要求了

~~~小小扩展

在我了解HashMap的常用方法时,我看到了这个

在这里插入图片描述

HashSet不是Collection的子类吗,怎么底层却是用HashMap实现

是因为HashSet不允许有重复值和HashMap不允许有重复key值吗?

难道HashMap才是HashSet的爸爸?

于是我上网找了下资料HashSet实现原理

在这里插入图片描述

大概意思就是

HashSet底层采用哈希表HashTable实现,在HashSet中,元素都存到HashMap键值对 (Entry) 的Key,而Key值对应的Value值是一个统一的值

private static final Object PRESENT = new Object();

定义一个最终静态的Object对象作为HashMap中的所有value的值

说到底,HashSet应该是一个被削弱版的HashMap

好了,讲解的知识点到这,如有不对,还请大佬高抬贵手为小弟指点指点
在这里插入图片描述

在这里插入图片描述

  • 9
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值