Java--hashCode（散列码）介绍

最新推荐文章于 2021-02-21 12:56:24 发布

溜达的地鼠

最新推荐文章于 2021-02-21 12:56:24 发布

阅读量380

点赞数

分类专栏： java

java 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

介绍Hashcode之前先来看几个概念

在一个应用程序执行期间，如果一个对象的equals方法做比较所用到的信息没有被修改的话，则对该对象调用hashCode方法多次，它必须始终如一地返回同一个整数。
如果两个对象根据equals(Object o)方法是相等的，调用这两个对象中任一对象的hashCode方法必须产生相同的整数结果
如果两个对象根据equals(Object o)方法是不相等的，调用这两个对象中任一个对象的hashCode方法，可能会有相同的结果。但如果能不同，可以提高散列表的性能。

两个相等对象的equals方法一定为true, 但两个hashcode相等的对象不一定是相等的对象。

所以hashcode相等只能保证两个对象在一个HASH表里的同一条HASH链上，继而通过equals方法才能确定是不是同一对象，如果结果为true, 则认为是同一对象不在插入，否则认为是不同对象继续插入。

我们知道Set集合是不能重复，Map的Key也一样，那么集合是如何保证对象是不是重复的呢？这个地方就是用了hashCode的概念。

hashCode方法实际上返回的就是对象存储的物理地址（实际可能并不是）。这样一来，当集合要添加新的元素时，先调用这个元素的hashCode方法，就一下子能定位到它应该放置的物理位置上。如果这个位置上没有元素，它就可以直接存储在这个位置上，不用再进行任何比较了；如果这个位置上已经有元素了，就调用它的equals方法与新元素进行比较，相同的话就覆写，不相同就存储，所以这里存在一个冲突解决的问题

所以，Java对于eqauls方法和hashCode方法是这样规定的：
1、如果两个对象相同，那么它们的hashCode值一定要相同；
2、如果两个对象的hashCode相同，它们并不一定相同

hashcode这个方法用来快速查找定位对象，在维护HashMap的key值唯一或HashSet不允许重复值时被用来检索。

在java中,存取数据的性能,一般来说当然是首推数组,但是在数据量稍大的容器选择中,Hashtable将有比数据性能更高的查询速度.具体原因看下面的内容.

Hashtable在存储数据时,一般先将该对象的HashCode和0x7FFFFFFF做与操作,因为一个对象的HashCode可以为负数,这样操作后可以保证它为一个正整数.然后以Hashtable的长度取模,得到该对象在Hashtable中的索引.

index = (o.hashCode() & 0x7FFFFFFF)%hs.length;

这个对象就会直接放在Hashtable的第index位置,对于写入,这和数组一样,把一个对象放在其中的第index位置,但如果是查询,经过同样的算法,Hashtable可以直接从第index取得这个对象,而数组却要做循环比较.所以对于数据量稍大时,Hashtable的查询比数据具有更高的性能.

既然可以根据HashCode直接定位对象在Hashtable中的位置,那么为什么Hashtable要用key来做映射呢(为了一些思维有障碍的人能看到懂我加了一句话:而不是直接放value呢)?这就是关系Hashtable性能问题的最重要的问题:Hash冲突.

前面提到不同对象的hashCode可能是相同的，最终导致计算处理的索引也是相同的，因此对于索引相同的对象,在该index位置存放了多个对象,这些值要想能正确区分,就要依靠key本身和hashCode来识别.

如何从多个属性中采样出能具有多样性的hashCode的属性,这是一个性能和多样性相矛盾的地方,如果所有属性都参与散列,当然hashCode的多样性将大大提高,但牺牲了性能,而如果只有少量的属性采样散列,极端情况会产生大量的散列冲突,如对”人”的属性中,如果用性别而不是姓名或出生日期,那将只有两个或几个可选的hashcode值,将产生一半以上的散列冲突.所以如果可能的条件下,专门产生一个序列用来生成HashCode将是一个好的选择(当然产生序列的性能要比所有属性参与散列的性能高的情况下才行,否则还不如直接用所有属性散列).

溜达的地鼠

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Java--hashCode（散列码）介绍

介绍Hashcode之前先来看几个概念在一个应用程序执行期间，如果一个对象的equals方法做比较所用到的信息没有被修改的话，则对该对象调用hashCode方法多次，它必须始终如一地返回同一个整数。如果两个对象根据equals(Object o)方法是相等的，调用这两个对象中任一对象的hashCode方法必须产生相同的整数结果
复制链接

扫一扫