1、equals和hashCode的作用
(1)equals()
equals方法是超类Object中的方法,用来判断两个对象是否相同,默认情况下是通过判断对象间的内存地址来决定是否相同。重写后,可以根据内容是否相同来决定对象是否相同。
(2)hashCode
a、概述
hashCode()方法返回的就是一个数值,也即哈希码。这个哈希码的作用是确定该对象在哈希表中的索引位置。从方法的名称上就可以看出,其目的是生成一个hash码。hash码的主要用途就是在对对象进行散列的时候作为key输入,据此很容易推断出,我们需要每个对象的hash码尽可能不同,这样才能保证散列的存取性能。事实上,Object类提供的默认实现确实保证每个对象的hash码不同(在对象的内存地址基础上经过特定算法返回一个hash码)。
b、hashCode作用
要理解hashCode作用,需要先知道Java中的集合。Java中的集合包括Set,set中的元素无序,但元素不可重复。问题是如何保证不重复呢?应该依据什么来判断两个元素是否重复呢?
如果仅仅使用Object.equals方法的话,每增加一个元素就检查一次,那么当元素很多时,后添加到集合中的元素比较的次数就非常多了,大大降低操作效率。 所以,Java采用了哈希表的原理,当集合要添加新的元素时,先调用这个元素的hashCode方法,就一下子能定位到它应该放置的物理位置上。 如果这个位置上没有元素,它就可以直接存储在这个位置上,不用再进行任何比较了;如果这个位置上已经有元素了,就调用它的equals方法与新元素进行比较,相同的话说明要加入的是重复数据所以就不存入,不相同就散列其它的地址。这样的话实际调用equals方法的次数就大大降低了,操作效率也得到了很大提升。(简言之,hashCode的存在,通过hash值定位位置,然后通过equals解决可能存在的冲突,大大减少了equals比较次数)
关于equals和hashCode的一些结论:
(1)hashCode返回对象的哈希码,支持该方法是为哈希表提供一些优点,例如,HashMap 提供的哈希表。
(2)同一个对象未发生改变时多次调用hashCode()返回值必须相同,
(3)两个对象equals不相等,那么两对象的hashCode()返回必定不同(此处可用来提高哈希表性能)
(4)两个对象的hashCode()返回值相同,两对象不一定相同,还需要通过equals()再次判断
(5)当equals方法被重写时,通常有必要重写 hashCode 方法
通过第(1)点可以看出,hashCode() 在散列表中才有用,在其它情况下没用。在散列表中hashCode() 的作用是获取对象的散列码,进而确定该对象在散列表中的位置,当对象不会用来创建像hashMap、hashSet等散列表时,hashCode()实际上用不上。
2、案例
(1)有问题的案例(自定义类,没有重写equals和hashCode)
public class HashEqualsDemo {
public static void main(String[] args) {
HashSet set = new HashSet();
Person p1 = new Person("1");
Person p2 = new Person("1");
set.add(p1);
set.add(p2);
for (Object a : set) {
System.out.println(a);
}
}
class Person {
private String age;
Person(String age) {
this.age = age;
}
@Override
public String toString() {
return "Person{" + "age='" + age + '\'' + '}';
}
}
结果会发现set中存入了两个内容一样的Person对象。原因如下:
set.add(p1);:set集合为空,找到对象p1的hashCode对应在哈希表中的存储区,直接存入对象p1
set.add(p2);:首先判断该对象p2的hashCode值对应哈希表中所在的存储区域是否有相同的hashCode,Person中未重写hashCode()此处调用Object类中的hashCode(),所以jdk使用默认Object的hashCode方法,返回内存地址转换后的整数,因为p1、p2为不同对象,地址值不同,所以这里不存在与p2相同hashCode值的对象,直接存入对象p2。所以可知Set集合中出现重复的原因了。都是因为hashCode、equals的不规范使用。
(2)修正后的案例(自定义类,重写了equals和hashCode)
从Jdk源码的注释中可以看出,hashCode() 在散列表中才会发挥作用,当对象无需创建像HashMap、HashSet等集合时,可以不用重写hashCode方法,但是如果有使用到对象的哈希集合等操作时,必须重写hashCode()和equals()。重写后,可以保证set不存在重复的person对象。
class Person {
private String age;
Person(String age) {
this.age = age;
}
//重写equals()
@Override
public boolean equals(Object obj) {
if (obj == null || !(obj instanceof Person)) {
return false;
}
//地址相同必相等
if (obj == this) {
return true;
}
Person person = (Person) obj;
//地址不同比较值是否相同
return person.age.equals(this.age);
}
//重写hashCode()
@Override
public int hashCode() {
return Objects.hash(age);
}
@Override
public String toString() {
return "Person{" + "age='" + age + '\'' + '}';
}
}
最后小结:
(1)hashCode主要用于提升查询效率提高哈希表性能,来确定在散列结构中对象的存储地址
(2)重写equals()必须重写hashCode()
(3)哈希存储结构中,添加元素重复性校验的标准就是先检查hashCode值,后判断equals()
(4)两个对象equals()相等,hashcode()必定相等
(5)两个对象hashcode()不等,equals()必定也不等
(6)两个对象hashcode()相等,对象不一定相等,需要通过equals()进一步判断。
参考博客:
(2)https://blog.csdn.net/qq_33619378/article/details/92661494