一、关于哈希算法
哈希算法,用于提高在集合中查找元素的效率。这种方式将集合分成若干个存储区域(可以看成一个个桶),每个对象都可以计算出一个哈希码,可以根据哈希码分组,每组分别对应某个存储区域,如此每个对象可以根据它的哈希码被分配到不同的存储区域(不同的桶中)。
二、equals和hashcode
在研究这个问题之前,首先说明一下JDK对equals(Object obj)和hashCode()这两个方法的定义和规范:在Java中任何一个对象都具备equals(Object obj)和hashCode()这两个方法,因为他们是在Object类中定义的。 equals(Object obj)方法用来判断两个对象是否“相同”,如果“相同”则返回true,否则返回false(在Object类中默认实现是用“==”)。 hashCode()方法返回一个int数,在Object类中的默认实现是“将该对象的内部地址转换成一个整数返回”。
当equals方法被重写时,通常有必要重写 hashCode 方法,以维护 hashCode 方法的常规协定,该协定声明相等对象必须具有相等的哈希码。
equals得出两对象相等 —> 两对象的hashcode值一定相等。但两对象的hashcode值相等—>equals得出两对象相等不成立。(hashcode值相等是两对象相等的必要不充分条件)。
问题:为什么说重写了equals方法就需要重写hashcode方法?
答:实际上这只是一条规范,如果不这样做程序也可以执行,只不过会隐藏bug。一般一个类的对象如果会存储在HashTable,HashSet,HashMap等散列存储结构中,那么重写equals后最好也重写hashCode,否则会导致存储数据的不唯一性(存储了两个equals相等的数据)。
问中问:为什么对象存储在在map和set中,只重写equals而不重写hashcode方法就会导致数据的不唯一性。
先展示一张图:
如上图所示,在存储一个对象时,先进行hashCode值的比较,然后进行equals的比较。
如果只重写了equals方法没有重写hashcode方法,则对象默认使用Object的hashcode方法,该方法默认实现是“将该对象的内部地址转换成一个整数返回”。 因此会出现集合中数据的不唯一性。
equals方法和hashcode方法缺其一都有可能产生数据不唯一性问题
同一对象在执行期间若已经存储在集合中,则不能修改影响hashCode值的相关信息,否则会导致内存泄露问题。