Java 的 hashCode 值怎么生成的?和对象的内存地址有关系?

先看一个最简单的打印

System.out.println(new Object());

会输出该类的全限定类名和一串字符串:

java.lang.Object@6659c656

@符号后面的是什么?是 hashcode 还是对象的内存地址?还是其他的什么值?

其实@后面的只是对象的 hashcode 值,16进制展示的 hashcode 而已,来验证一下:

Object o = new Object();
int hashcode = o.hashCode();
// toString
System.out.println(o);
// hashcode 十六进制
System.out.println(Integer.toHexString(hashcode));
// hashcode
System.out.println(hashcode);
// 这个方法,也是获取对象的 hashcode;不过和 Object.hashcode 不同的是,该方法会无视重写的hashcode
System.out.println(System.identityHashCode(o));

输出结果:

java.lang.Object@6659c656
6659c656
1717159510
1717159510

那对象的 hashcode 到底是怎么生成的呢?真的就是内存地址吗?

本文内容基于 JAVA 8 HotSpot

hashCode 的生成逻辑

JVM 里生成 hashCode 的逻辑并没有那么简单,它提供了好几种策略,每种策略的生成结果都不同。

来看一下 openjdk 源码里生成 hashCode 的核心方法:

static inline intptr_t get_next_hash(Thread * Self, oop obj) {
  intptr_t value = 0 ;
  if (hashCode == 0) {
     // This form uses an unguarded global Park-Miller RNG,
     // so it's possible for two threads to race and generate the same RNG.
     // On MP system we'll have lots of RW access to a global, so the
     // mechanism induces lots of coherency traffic.
     value = os::random() ;
  } else
  if (hashCode == 1) {
     // This variation has the property of being stable (idempotent)
     // between STW operations.  This can be useful in some of the 1-0
     // synchronization schemes.
     intptr_t addrBits = intptr_t(obj) >> 3 ;
     value = addrBits ^ (addrBits >> 5) ^ GVars.stwRandom ;
  } else
  if (hashCode == 2) {
     value = 1 ;            // for sensitivity testing
  } else
  if (hashCode == 3) {
     value = ++GVars.hcSequence ;
  } else
  if (hashCode == 4) {
     value = intptr_t(obj) ;
  } else {
     // Marsaglia's xor-shift scheme with thread-specific state
     // This is probably the best overall implementation -- we'll
     // likely make this the default in future releases.
     unsigned t = Self->_hashStateX ;
     t ^= (t << 11) ;
     Self->_hashStateX = Self->_hashStateY ;
     Self->_hashStateY = Self->_hashStateZ ;
     Self->_hashStateZ = Self->_hashStateW ;
     unsigned v = Self->_hashStateW ;
     v = (v ^ (v >> 19)) ^ (t ^ (t >> 8)) ;
     Self->_hashStateW = v ;
     value = v ;
  }

  value &= markOopDesc::hash_mask;
  if (value == 0) value = 0xBAD ;
  assert (value != markOopDesc::no_hash, "invariant") ;
  TEVENT (hashCode: GENERATE) ;
  return value;
}

从源码里可以发现,生成策略是由一个 hashCode 的全局变量控制的,默认为5;而这个变量的定义在另一个头文件里:

product(intx, hashCode, 5,                                            
         "(Unstable) select hashCode generation algorithm" ) 

源码里很清楚了……(非稳定)选择 hashCode 生成的算法,而且这里的定义,是可以由 jvm 启动参数来控制的,先来确认下默认值:

java -XX:+PrintFlagsFinal -version | grep hashCode

intx hashCode                                  = 5                                   {product}
openjdk version "1.8.0_282"
OpenJDK Runtime Environment (AdoptOpenJDK)(build 1.8.0_282-b08)
OpenJDK 64-Bit Server VM (AdoptOpenJDK)(build 25.282-b08, mixed mode)

所以我们可以通过 jvm 的启动参数来配置不同的 hashcode 生成算法,测试不同算法下的生成结果:

-XX:hashCode=N

现在来看看,每种 hashcode 生成算法的不同表现。

第 0 种算法

if (hashCode == 0) {
     // This form uses an unguarded global Park-Miller RNG,
     // so it's possible for two threads to race and generate the same RNG.
     // On MP system we'll have lots of RW access to a global, so the
     // mechanism induces lots of coherency traffic.
     value = os::random();
  }

这种生成算法,使用的一种Park-Miller RNG的随机数生成策略。不过需要注意的是……这个随机算法在高并发的时候会出现自旋等待

第 1 种算法

if (hashCode == 1) {
    // This variation has the property of being stable (idempotent)
    // between STW operations.  This can be useful in some of the 1-0
    // synchronization schemes.
    intptr_t addrBits = intptr_t(obj) >> 3 ;
    value = addrBits ^ (addrBits >> 5) ^ GVars.stwRandom ;
}

这个算法,真的是对象的内存地址了,直接获取对象的 intptr_t 类型指针

第 2 种算法

if (hashCode == 2) {
    value = 1 ;            // for sensitivity testing
}

这个就不用解释了……固定返回 1,应该是用于内部的测试场景。

有兴趣的同学,可以试试-XX:hashCode=2来开启这个算法,看看 hashCode 结果是不是都变成 1 了。

第 3 种算法

if (hashCode == 3) {
    value = ++GVars.hcSequence ;
}

这个算法也很简单,自增嘛,所有对象的 hashCode 都使用这一个自增变量。来试试效果:

System.out.println(new Object());
System.out.println(new Object());
System.out.println(new Object());
System.out.println(new Object());
System.out.println(new Object());
System.out.println(new Object());

//output
java.lang.Object@144
java.lang.Object@145
java.lang.Object@146
java.lang.Object@147
java.lang.Object@148
java.lang.Object@149

果然是自增的……有点意思

第 4 种算法

if (hashCode == 4) {
    value = intptr_t(obj) ;
}

这里和第 1 种算法其实区别不大,都是返回对象地址,只是第 1 种算法是一个变体。

第 5 种算法

最后一种,也是默认的生成算法,hashCode 配置不等于 0/1/2/3/4 时使用该算法:

else {
     // Marsaglia's xor-shift scheme with thread-specific state
     // This is probably the best overall implementation -- we'll
     // likely make this the default in future releases.
     unsigned t = Self->_hashStateX ;
     t ^= (t << 11) ;
     Self->_hashStateX = Self->_hashStateY ;
     Self->_hashStateY = Self->_hashStateZ ;
     Self->_hashStateZ = Self->_hashStateW ;
     unsigned v = Self->_hashStateW ;
     v = (v ^ (v >> 19)) ^ (t ^ (t >> 8)) ;
     Self->_hashStateW = v ;
     value = v ;
  }

这里是通过当前状态值进行异或(XOR)运算得到的一个 hash 值,相比前面的自增算法和随机算法来说效率更高,但重复率应该也会相对增高,不过 hashCode 重复又有什么关系呢……

本来 jvm 就不保证这个值一定不重复,像 HashMap 里的链地址法就是解决 hash 冲突用的.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: HashCode是一个Java中的方法,用于返回对象的哈希码。它通常用于确定一个对象的唯一标识符,以便在需要比较对象时快速查找和识别该对象。在使用集合框架时,哈希码在查找元素时非常有用,可以大大提高查找效率。 ### 回答2: hashcodeJava中Object类中的一个方法,用于计算对象的哈希码。 哈希码是一个用于标识对象的整数。它是根据对象的内部状态(即对象的属性)计算得出的。同样的输入会得到相同的哈希码,不同的输入会得到不同的哈希码。 hashcode方法的作用主要有两点: 1. 在集合框架中,如HashMap、HashSet等类,使用哈希码来确定对象的存储位置。哈希码作为一个索引,能够快速地定位对象所在的存储位置,提高了集合类的存取效率。 2. 在对象比较时,equals方法通常与hashcode方法一起使用。equals被用来判断两个对象是否相等,而hashcode则被用来判断两个对象是否“可能相等”。在重写equals方法时,一般也需要同时重写hashcode方法,以保证对象相等时它们的哈希码也相等。这样可以确保对象作为Map的键或者放入HashSet等集合类中时能够正确地进行查找和去重等操作。 需要注意的是,哈希码并不是唯一的,即不同的对象可能会生成相同的哈希码。因此,在编写代码时不能依赖于哈希码的唯一性,而应当保证equals方法的正确性,以确保判断对象是否相等时的准确性。 ### 回答3: hashcode对象在内存中的唯一标识符,它是通过哈希函数计算出来的一个整数。在Java中,hashcode是由Object类的hashCode()方法生成的。 hashcode的作用有两个方面: 1. 在哈希表中用作对象的存储索引。哈希表是一种常用的数据结构,它可以快速存储和查询数据。哈希函数将对象映射到一个特定的索引位置,不同的对象会得到不同的hashcode,从而实现快速的存储和查找。 2. 在集合类中用来快速定位元素。集合类如HashMap、HashSet等都是基于哈希表实现的,它们通过对象hashcode来确定元素的存储位置。当需要查找或删除元素时,只需要计算待查找对象hashcode,就可以快速定位到对应的存储位置,从而提高了操作的效率。 需要注意的是,hashcode并不是唯一的,不同的对象可能会得到相同的hashcode,这就是所谓的哈希冲突。为了解决冲突,Java中提供了equals()方法来判断两个对象是否相等。当两个对象hashcode相等且equals方法返回true时,这两个对象被认为是相等的。因此,对于自定义的类,我们需要重写hashCode()和equals()方法,保证其正确性和一致性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值