== 和 equals和hashCode

最新推荐文章于 2024-10-01 09:29:45 发布

持续学习的seven

最新推荐文章于 2024-10-01 09:29:45 发布

阅读量26

点赞数

分类专栏： # Java基础文章标签： java

本文链接：https://blog.csdn.net/weixin_39774936/article/details/133244145

版权

Java基础专栏收录该内容

13 篇文章 0 订阅

订阅专栏

文章探讨了Java中Integer对象的赋值行为，重点分析了equals和hashCode方法的工作原理，以及如何影响对象比较。同时介绍了解决哈希冲突的不同方法，如拉链法、开放地址法和再散列法。

摘要由CSDN通过智能技术生成

==

“==” 是运算符

如果比较的对象是基本数据类型，则比较的是其存储的值是否相等；
如果比较的是引用数据类型，则比较的是所指向对象的地址值是否相等（是否是同一个对象）。

 public static void main(String[] args) {
    Person p1 = new Person("123");
    Person p2 = new Person("123");
    int a = 10;
    int b = 10;
    System.out.println(a == b);
    System.out.println(p1 == p2);//显然不是同一个对象
}
//输出
true
false

Integer经典问题

这里引申出一个经典问题，看下面代码

Integer a = 100;
Integer b = 100;
System.out.println(a == b);

Integer c = 200;
Integer d = 200;
System.out.println(c == d);

//输出
true
false

为什么第一个输出的是true，第二个输出的是false？
Integer a = 100的这种直接赋值操作，是调⽤Integer.valueOf(100)方法，从Integer.valueOf()源码可以看到，返回的是Integer对象，但这里的实现并不是简单的new Integer，而是先判断 i 这个值是否在IntegerCache范围内，如果在，直接返回IntegerCache中的值，如果不在则new Integer

public static Integer valueOf(int i) {
    if (i >= IntegerCache.low && i <= IntegerCache.high)
        return IntegerCache.cache[i + (-IntegerCache.low)];
    return new Integer(i);
}

 private static class IntegerCache {
    static final int low = -128;
    static final int high;
    static final Integer cache[];

    static {
        // high value may be configured by property
        int h = 127;
        String integerCacheHighPropValue =
            sun.misc.VM.getSavedProperty("java.lang.Integer.IntegerCache.high");
        if (integerCacheHighPropValue != null) {
            try {
                int i = parseInt(integerCacheHighPropValue);
                i = Math.max(i, 127);
                // Maximum array size is Integer.MAX_VALUE
                h = Math.min(i, Integer.MAX_VALUE - (-low) -1);
            } catch( NumberFormatException nfe) {
                // If the property cannot be parsed into an int, ignore it.
            }
        }
        high = h;

        cache = new Integer[(high - low) + 1];
        int j = low;
        for(int k = 0; k < cache.length; k++)
            cache[k] = new Integer(j++);

        // range [-128, 127] must be interned (JLS7 5.1.7)
        assert IntegerCache.high >= 127;
    }

    private IntegerCache() {}
}

从源码可以看到，默认Integer cache 的下限是-128，上限默认127。当赋值100给Integer时，刚好在这个范围内，所以从cache中取对应的Integer并返回，所以a和b返回的是同一个对象，所以 == 比较是相等的，当赋值200给Integer时，不在cache 的范围内，所以会new Integer并返回，当然 == 比较的结果是不相等的。

扩展：
Byte,Short,Integer,Long 这 4 种包装类默认创建了数值 [-128，127] 的相应类型的缓存数据，Character 创建了数值在 [0,127] 范围的缓存数据，Boolean 直接返回 True or False

System.out.println(Integer.valueOf(-128) == Integer.valueOf(-128));//1.true
System.out.println(Integer.valueOf(127) == Integer.valueOf(127));//2.true
System.out.println(Integer.valueOf(128) == Integer.valueOf(128));//3.false
System.out.println(Integer.parseInt("128") == Integer.valueOf(128));//4.true

1、2、3都好理解，缓存范围是 [-128，127]，1、2都在范围内，返回的是缓存中的对象，因此输出true，3不在范围内，返回的时新 new 的Integer，因此输出false。

那为什么4输出的是true呢？ 128 在缓存范围外，按道理会 new 出一个Integer对象，为什么输出true呢？

首先Integer.parseInt方法返回的是int 基本数据类型，不是对象，也就是说 Integer.parseInt(“128”) = 128

public static int parseInt(String s) throws NumberFormatException {
    return parseInt(s,10);
}

当进行比较(“==”)运算时，会进行自动拆箱，也就是说 Integer.valueOf(128) 生成的 Integer 会自动拆箱成128
那么比较两个相等的额数值自然是true的

当基础类型与它们的包装类有如下几种情况时，编译器会自动进行装箱或拆箱：
赋值操作（装箱或拆箱）
进行加减乘除混合运算（拆箱）
进行>,<,==比较运算（拆箱）
调用equals进行比较（装箱）
ArrayList、HashMap等集合类添加基础类型数据时（装箱）

equals和hashCode

equals

作用是用来判断两个对象是否相等。

equals() 定义在JDK的Object.java中。通过判断两个对象的地址是否相等(即，是否是同一个对象)来区分它们是否相等。源码如下：

public boolean equals(Object obj) {
    return (this == obj);
}

equals 方法不能用于比较基本数据类型，如果没有对 equals 方法进行重写，则相当于“==”，比较的是引用类型的变量所指向的对象的地址值。

一般情况下，类会重写equals方法用来比较两个对象的内容是否相等。比如String类中的equals()是被重写了，比较的是对象的值。

hashcode

hashcode特性体现主要在它的查找效率上，O(1)的复杂度，在Set和Map这种使用哈希表结构存储数据的集合中。hashCode方法的就大大体现了它的价值，主要用于在这些集合中确定对象在整个哈希表中存储的区域。
如果两个对象相同，则这两个对象的equals方法返回的值一定为true，两个对象的hashCode方法返回的值也一定相同。(equals相同，hashcode一定相同，因为重写的hashcode就是计算属性的hashcode值)
如果两个对象返回的HashCode的值相同，但不能够说明这两个对象的equals方法返回的值就一定为true，只能说明这两个对象在存储在哈希表中的同一个桶中。

只重写了equals方法，未重写hashCode方法

在Java中equals方法用于判断两个对象是否相等，而HashCode方法在java中主要由于哈希算法中的寻域的功能（也就是寻找数据应该存储的区域的）。在类似于set和map集合的结构中，java为了提高在集合中查询匹配元素的效率问题，引入了哈希算法，通过某种算法及我们的HashCode方法得到对象的hash码，再通过hash码推算出数据应该存储的位置。然后再进行equals操作进行匹配，减少了比较次数，提高了效率。

public class Person {
    String name;

    public Person(String name) {
        this.name = name;
    }

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        Person person = (Person) o;
        return Objects.equals(name, person.name);
    }

    public static void main(String[] args) {
        Person p1 = new Person("123");
        Person p2 = new Person("123");

        System.out.println(p1 == p2);//1、false
        System.out.println(p1.hashCode() == p2.hashCode());//2、false
        System.out.println(p1.equals(p2));//3、true

        Set<Person> set = new HashSet<>();
        set.add(p1);
        set.add(p2);
        System.out.println(set.size());//4、2
    }
}

当只重写了equals方法，未重写hashCode方法时，equals方法判断两个对象是否相等时，返回的是true(第三个输出)，这是因为我们重写equals方法时，是对属性的比较；但判断两个对象的hashCode值是否相等时，返回的是false(第二个输出)，在没有重写hashCode方法的情况下，调用的是Object的hashCode方法，返回的是本对象的hashCode值，两个对象不一样，因此hashCode值不一样。
在set和map中，首先判断两个对象的hashCode方法返回的值是否相等，如果相等然后再判断两个对象的equals方法，如果hashCode方法返回的值不相等，则直接会认为两个对象不相等，不进行equals方法的判断。因此在set添加对象时，因为hashCode值已经不一致，判断出p1和p2是两个对象，都会添加进set集合中，因此返回集合中数据个数为 2 (第四个输出)

重写hashCode方法：重写hashcode方法时，一般也是对属性值进行hash

@Override
public int hashCode() {
    return Objects.hash(name);
}

重写了hashCode后，其是对属性值的hash，p1和p2的属性值一致，因此p1.hashCode() == p2.hashCode()为true，再进行equals方法的判断也为true，认为是一个对象，因此set集合中只有一个对象数据。

为什么重写hashCode一定也要重写equals方法？

如果两个对象的hashCode相同，它们是并不一定相同的，因为equals方法不相等而hashCode方法返回的值却有可能相同的，比如两个不同的对象hash到同一个桶中

hashCode方法实际上是通过一种算法得到一个对象的hash码，这个hash码是用来确定该对象在哈希表中具体的存储区域的。返回的hash码是int类型的所以它的数值范围为 [-2147483648 - +2147483647] 之间的，而超过这个范围，实际会产生溢出，溢出之后的值实际在计算机中存的也是这个范围的。比如最大值 2147483647 + 1 之后并不是在计算机中不存储了，它实际在计算机中存储的是-2147483648。在java中hash码也是通过特定算法得到的，所以很难说在这个范围内情况下不会不产生相同的hash码的。也就是说常说的哈希碰撞，因此不同对象可能有相同的hashCode的返回值。

因此equals方法返回结果不相等，而hashCode方法返回的值却有可能相同！

为什么重写equals一定也要重写hashCode方法？

这个是针对set和map这类使用hash值的对象来说的

只重写equals方法，不重写hashCode方法：
- 有这样一个场景有两个Person对象，可是如果没有重写hashCode方法只重写了equals方法，equals方法认为如果两个对象的name相同则认为这两个对象相同。这对于equals判断对象相等是没问题的。
- 对于set和map这类使用hash值的对象来说，由于没有重写hashCode方法，此时返回的hash值是不同的，因此不会去判断重写的equals方法，此时也就不会认为是相同的对象。
重写hashCode方法不重写equals方法
- 不重写equals方法实际是调用Object方法中的equals方法，判断的是两个对象的堆内地址。而hashCode方法认为相等的两个对象在equals方法处并不相等。因此也不会认为是用一个对象
- 因此重写equals方法时一定也要重写hashCode方法，重写hashCode方法时也应该重写equals方法。

总结：对于普通判断对象是否相等来说，只equals是可以完成需求的，但是如果使用set，map这种需要用到hash值的集合时，不重写hashCode方法，是无法满足需求的。

扩展：解决哈希冲突的三种方法

拉链法、开放地址法、再散列法

拉链法

HashMap，HashSet其实都是采用的拉链法来解决哈希冲突的，就是在每个位桶实现的时候，采用链表（jdk1.8之后采用链表+红黑树）的数据结构来去存取发生哈希冲突的输入域的关键字（也就是被哈希函数映射到同一个位桶上的关键字）

拉链法的装载因子为n/m（n为输入域的关键字个数，m为位桶的数目）

开放地址法

所谓开放地址法就是发生冲突时在散列表（也就是数组里）里去寻找合适的位置存取对应的元素，就是所有输入的元素全部存放在哈希表里。也就是说，位桶的实现是不需要任何的链表来实现的，换句话说，也就是这个哈希表的装载因子不会超过1。

它的实现是在插入一个元素的时候，先通过哈希函数进行判断，若是发生哈希冲突，就以当前地址为基准，根据再寻址的方法（探查序列），去寻找下一个地址，若发生冲突再去寻找，直至找到一个为空的地址为止。

探查序列的方法:

线性探查
平方探测
伪随机探测

线性探查

di =1，2，3，…，m-1；这种方法的特点是：冲突发生时，顺序查看表中下一单元，直到找出一个空单元或查遍全表。

（使用例子：ThreadLocal里面的ThreadLocalMap中的set方法）

private void set(ThreadLocal<?> key, Object value) {

    // We don't use a fast path as with get() because it is at
    // least as common to use set() to create new entries as
    // it is to replace existing ones, in which case, a fast
    // path would fail more often than not.

    Entry[] tab = table;
    int len = tab.length;
    int i = key.threadLocalHashCode & (len-1);

	//线性探测的关键代码
    for (Entry e = tab[i];
         e != null;
         e = tab[i = nextIndex(i, len)]) {
        ThreadLocal<?> k = e.get();

        if (k == key) {
            e.value = value;
            return;
        }

        if (k == null) {
            replaceStaleEntry(key, value, i);
            return;
        }
    }

    tab[i] = new Entry(key, value);
    int sz = ++size;
    if (!cleanSomeSlots(i, sz) && sz >= threshold)
        rehash();
}

但是这样会有一个问题，就是随着键值对的增多，会在哈希表里形成连续的键值对。
当插入元素时，任意一个落入这个区间的元素都要一直探测到区间末尾，并且最终将自己加入到这个区间内。这样就会导致落在区间内的关键字Key要进行多次探测才能找到合适的位置，并且还会继续增大这个连续区间，使探测时间变得更长，这样的现象被称为“一次聚集（primary clustering）”。

平方探测

在探测时不一个挨着一个地向后探测，我们可以跳跃着探测，这样就避免了一次聚集。

di=1^2，-12，2^2，-22，…，k^2，-k2；这种方法的特点是：冲突发生时，在表的左右进行跳跃式探测，比较灵活。

虽然平方探测法解决了线性探测法的一次聚集，但是它也有一个小问题，就是关键字key散列到同一位置后探测时的路径是一样的。

这样对于许多落在同一位置的关键字而言，越是后面插入的元素，探测的时间就越长。