为什么重写了equals()还要重写hashcode()?

最新推荐文章于 2023-08-28 22:33:56 发布

此生辽阔

最新推荐文章于 2023-08-28 22:33:56 发布

阅读量1.8k

点赞数 2

分类专栏： Java # 校招/面试题/面经

本文链接：https://blog.csdn.net/ningmengshuxiawo/article/details/118974654

版权

Java 同时被 2 个专栏收录

41 篇文章 9 订阅

订阅专栏

校招/面试题/面经

22 篇文章 3 订阅

订阅专栏

equals和hashcode间的关系：
1.如果两个对象相同（即equals比较返回true），那么他们的hashcode一定要相等
2.如果他们的hashcode相等，他们的equals不一定相等
为什么重写equals
我们比较两个对象，不需要他们的地址相同才能相等的，只需要他们的各个属性相同，我们就认为他们是相等的。
hashCode（）方法用于返回调用该方法的对象的散列码值，此方法返回整数类型的散列码值。
为什么重写equals还要重写hashcode
假设两个对象，重写了其equals方法，其相等条件是属性相等，equals比较之后返回true说明假设的两个对象相等，如果没有重写hashcode的话，其返回的依然是两个对象的内存地址，那么他们的hashcode不相同，这和上面的equals和hashcode间的关系相矛盾！所以如果根据equals(Object)方法，两个对象是相等的，那么在两个对象中的每个对象上调用hashCode()方法必须生成相同的整数结果。
注意：相等的对象必须有相同的散列码，反之散列码相同则不一定对象相等，而且不相等的对象并不一定需要有不同的散列码。
————————————————
版权声明：本文为CSDN博主「Hai-Yang-code」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/weixin_45007916/article/details/106011397

我所了解的应用场景是当我们写了一个类，如果要使用这个类的对象作为HashMap或者HashSet的key值的话，那么我们需要重写这个类的equals方法和hashcode方法，阅读本文需要一些Hashmap的源码分析能力

自定义类

先来自定义一个类user

import java.util.HashSet;

/**
 * Created by 此生辽阔 on 2021/7/20 22:27
 */
public class testRewriteHashCode {
    public static void main(String[] args) {
        HashSet hashSet = new HashSet();
        hashSet.add(new user("tom"));
        hashSet.add(new user("tom"));
        System.out.println( hashSet);
    }
   static class user{
        String name;

        public user(String name) {
            this.name = name;
        }
    }
}

从执行结果可以看到，两个user对象都被存进了 hashSet，但这并不是我们希望的结果，因为这两个对象的字段值完全相同，我们无法进行区分，我们更希望在hashSet中把字段值完全相同(user类的字段只有name)的对象视作同一个对象。
在这里插入图片描述

重写equals,不重写hashcode

  @Override
       public boolean equals(Object obj) {
           if(obj == null){
               return false;
           }
           user obj1 = (user)obj;
           if(this.name.equals(obj1.name) ){
               return true;
           }
           return false;
       }

运行结果
从结果可以看到，还是存进了两个对象，并不是我们想要的结果
在这里插入图片描述
我们打断点进入调试
请添加图片描述

可以看到，下图这里判断p=null,因为后插入的user对象跟先插入的user对象的hash值不一样，所以把新的user对象插入了数组中的另一个索引位置
在这里插入图片描述

我们可以看到此时的内存排列
在这里插入图片描述

这是hash值的计算代码，可以看到跟key的hashCode()方法有关，这里的key就是我们自定义的类user

 static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

为了让两个user对象判断为重复插入，我们需要重写hashCode()函数，使得字段值相同的user对象的哈希值计算相等

重写hashcode不重写equals

 @Override
       public int hashCode() {
           return name.hashCode();
       }

从下图结果可以看出，只重写hashcode不重写equals依然会把两个字段值相同的user对象都存进hashSet.
在这里插入图片描述
Debug分析
请添加图片描述

从添加完数据的内存布局我们可以看到，两个user对象都存进了数组中索引为3的位置。即形成了一条链表，可以看到这两个user对象的hashcode值一样，为了避免碰撞，从而形成了一条链表（先插入的user对象的next指针指向后插入的user对象）
在这里插入图片描述

调试过程中，我们发现下面这个if条件是不满足的

if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))

我们来分析一下，(k = p.key) == key这个肯定是不满足的，因为key是user对象，而对于引用类型，双等于比较的是对象地址，两个对象都是new出来的，地址肯定不一样

但是我们还可以寄希望于key.equals(k)，如果这个条件满足，那么整个if条件还是满足的

但是我们并没有重写user类的equals方法，那么这个equals方法就是沿用的父类的equals方法，父类即Object类

我们看看父类的equals方法

  public boolean equals(Object obj) {
        return (this == obj);
    }

可以看到，父类的equals方法调用的是==，那么我们没有重写equals的情况下，还是比较的是两个对象的地址，所以key.equals(k)为false

整个if语句不成立

接下来会判断p是否是 TreeNode，可以看到现在还没有转化成红黑树，所以判断条件也不成立
于是执行了下面的代码，将新插入的user对象挂载到之前的user对象后面形成了一条链表
在这里插入图片描述

重写equals和hashcode

import java.util.HashSet;

/**
 * Created by 此生辽阔 on 2021/7/20 22:27
 */
public class testRewriteHashCode {
    public static void main(String[] args) {
        HashSet hashSet = new HashSet();
        hashSet.add(new user("tom"));
        hashSet.add(new user("tom"));
        System.out.println( hashSet);
    }
   static class user{
        String name;

        public user(String name) {
            this.name = name;
        }

       @Override
       public int hashCode() {
           return name.hashCode();
       }

       @Override
       public boolean equals(Object obj) {
           if(obj == null){
               return false;
           }
           user obj1 = (user)obj;
           if(this.name.equals(obj1.name) ){
               return true;
           }
           return false;
       }
   }
}

从结果可以看到，虽然添加了两次元素，但是hashSet里面只有一个元素，这是因为重写了hashcode和equals方法之后，两个字段值相同的user对象的hash值计算相等且equals判断相等，经过debug分析，这种情况下，后插入的user对象会覆盖之前插入的user对象的value值（因为HashMap是key -value形式的，HashSet只是用了HashMap的key，HashSet的value默认为PRESENT，是HashSet的一个属性）

在这里插入图片描述
HashSet的value默认为PRESENT，是HashSet的一个属性，如下，准确地说是HashSet里面的map的每一个value都是PRESENT

  private transient HashMap<E,Object> map;
 private static final Object PRESENT = new Object();
public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }

Debug分析

请添加图片描述

经过debug分析，在user对象的字段值相等的情况下，且user类重写了hashcode和equals方法的情况下后插入的user对象会覆盖之前插入的user对象的value值，两个对象被判断为相同元素，不能重复插入HashSet

总结

当我们把自定义类的对象作为HashMap或者HashSet的key值的时候，我们应该重写自定义类的hashcode()方法和equals方法

如果不重写hashcode()方法和equals方法，我们将能够插入两个字段值完全相同的对象，这不利于我们再去HashMap或者HashSet中查找元素

如果只重写equals方法不重写hashcode方法，当两个对象的字段值完全一样时，计算出来的hashcode不一样，会将这两个对象插入到HashMap底层数组的不同位置（因为元素在数组中的索引是根据hash值计算的）

如果只重写hashcode方法不重写equals方法，则两个对象的字段值完全一样时，会在HashMap底层数组中形成一个链表

建议小伙伴们自己去Debug跑一下

附上HashMap的putVal方法的实现
在这里插入图片描述

 /**
     * Implements Map.put and related methods
     *
     * @param hash hash for key
     * @param key the key
     * @param value the value to put
     * @param onlyIfAbsent if true, don't change existing value
     * @param evict if false, the table is in creation mode.
     * @return previous value, or null if none
     */
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }