在Set接口,Map接口中,每一个储存到哈希表中的对象都要重写hashCode()方法和equals方法
在了解为什么要重写hashCode()和equals()方法之前我们先了解一下
一 、什么是hash 、hash表
简单说
- hash是一个函数,通过一系列的算法得到的值称为—— hashcode
- hash表(哈希表)则储存由该hash函数计算得出的所有hash值
二 、什么是hashcode
理解完hash后就很简单了,hashcode就是通过hash函数计算出的值
在JAVA中,每个对象的hashcode值决定了在哈希表中的存储位置
这里说的对象在hash表中的地址 跟 对象的物理地址(对象在内存中的地址)是完全不同的概念
而对象中的hashcode怎么来的呢
在顶级父类Object中,存在hashCode()方法,被native关键字修饰,说明该方法为原生函数——内部使用c / c++实现
当对象调用Object类中的hashCode()方法时,JVM通过调用原生函数计算得出该对象的hashcode值
Student s1 = new Student();
Student s2 = new Student();
Student s3 = new Student();
s1.hashCode(); // 557041912
s2.hashCode(); // 113471290
s3.hashCode(); // 985922955
对于任意两个不同的对象,其hash值相同的可能性极其小
这就体现了其优势:查询的快捷性 (用hashcode来代表对象在hash表中的位置)
以HashSet为例,根据对象的hashCode方法计算出该对象的hashcode,可以快速地找到要进行操作的对象位置。
三、Set接口的特征及其子类HashSet
Set接口存储特点:——储存引用类型
- 不允许元素重复
- 不会记录元素的添加先后顺序
HashSet为Set接口的实现类
HashSet底层采用哈希表实现,元素对象的hashCode值决定了在哈希表中的存储位置
其基本原理是:使用一个下标范围很大的数组来存储对象。通过一个函数,根据每个对象的信息计算得到一个函数值(即数组下标,hashcode),然后该单元数组来存储这个对象
每一个存储到哈希表中的对象,都得覆盖hashCode和equals方法用来判断是否是同一个对象
对象的hash算法是怎么计算,怎么判断的?
- 如果成员变量是基本数据类型,则根据变量数据参加计算后判断
- 如果成员变量是引用数据类型,则获得成员变量的哈希码值(原生函数)后,再参数计算后判断
当往HashSet集合中添加新的元素对象时,先会判断该对象和集合对象中的hashCode值:
-
不等: 直接把该新的对象存储到hashCode指定的位置
-
相等: 再继续判断新对象和集合对象中的equals做比较
- 若equals为true:则视为是同一个对象,则不保存。
- 若equals为false:存储在之前对象同槽位的链表上 —— 哈希碰撞
这里简单概括下什么是哈希碰撞 —— 哈希冲突
当添加元素时,在判断hashCode相等的情况下的情况下,再判断equals,如果返回值为false,则这个时候会以链表的形式在同一个位置上存放两个元素,这会使得HashSet的性能降低,因为不能快速定位了
四、为什么重写equals()方法后也要重写hashCode()方法
我们在定义类时,想要把它的实例保存在Set集合中时,按照原则,我们需要重写了equals()方法和hashCode()方法
hashCode()的作用就是获取哈希码 (hashCode),也称为散列码,这个哈希码的作用是确定该对象在哈希表中的索引位置
这里小伙伴就会带有疑问了?
为什么重写equals()方法后也要重写hashCode()方法
这里我们先了解一些hashCode()与equals()之间的规定
- 如果两个对象相等,则 hashcode 一定也是相同的
- 两个对象相等,对两个对象分别调用 equals 方法都返回 true
- 两个对象有相同的 hashcode 值,它们也不一定是相等的
首先我们定义一个Student类,假设只重写了equals()方法,没有重写hashCode()方法
public class Student {
private String name;
//有参构造器
public Student(String name){
this.name = name;
}
//重写equals方法
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
Student student = (Student) o;
return Objects.equals(name, student.name);
}
public static void main(String[] args) {
Student s1 = new Student("张三");
Student s2 = new Student("张三");
System.out.println(s1.hashCode()); // 2083562754
System.out.println(s2.hashCode()); // 1239731077
System.out.println(s1.equals(s2)); // true
//创建HashSet集合
Set stus = new HashSet<Student>();
stus.add(s1); //添加成功
stus.add(s2); //添加成功
}
}
从结果可以看出,重写后的equals()方法,在判断s1,s2的内容之后返回true
在一般情况下,我们会希望s1,s2的成员变量值相同时就认为他们相同,我们就会重写equals()方法
我们期望的是当s1,s2对象内容相等时,不进行add添加操作,而往Set集合里添加s2时,会先判断s1和s2中的hashCode值,这里hashCode值不等,直接把 s2对象 存储到hashCode指定的位置,这就不符合我们的期望
所以我们要重写hashCode()方法,来维护HashCode规定——(两个对象相等其哈希值一定相等)再看看结果
<font size = 5>这时就说明了重写hashCode()的重要性</font>
public class Student {
private String name;
//有参构造器
public Student(String name){
this.name = name;
}
//重写equals方法
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
Student student = (Student) o;
return Objects.equals(name, student.name);
}
//重写hashCode方法
public int hashCode() {
return Objects.hash(name);
}
public static void main(String[] args) {
Student s1 = new Student("张三");
Student s2 = new Student("张三");
System.out.println(s1.hashCode()); // 774920
System.out.println(s2.hashCode()); // 774920
System.out.println(s1.equals(s2)); // true
//创建HashSet集合
Set stus = new HashSet<Student>();
stus.add(s1); //添加成功
stus.add(s2); //添加失败
}
}
这里s2添加操作失败,add()方法返回false
这下就符合我们的要求了
~~~小小扩展
在我了解HashMap的常用方法时,我看到了这个
HashSet不是Collection的子类吗,怎么底层却是用HashMap实现
是因为HashSet不允许有重复值和HashMap不允许有重复key值吗?
难道HashMap才是HashSet的爸爸?
于是我上网找了下资料HashSet实现原理
大概意思就是
HashSet底层采用哈希表HashTable实现,在HashSet中,元素都存到HashMap键值对 (Entry) 的Key,而Key值对应的Value值是一个统一的值
private static final Object PRESENT = new Object();
定义一个最终静态的Object对象作为HashMap中的所有value的值
说到底,HashSet应该是一个被削弱版的HashMap
好了,讲解的知识点到这,如有不对,还请大佬高抬贵手为小弟指点指点