- 首先我们都知道hashSet中的元素和hashMap中的key都不允许有重复值,那它是怎么判断插入一个数据时,集合中是否已经有该对象了呢?
也许大多数人都会想到调用equals方法来逐个进行比较,这个方法确实可行。但是如果集合中已经存在一万条数据或者更多的数据,如果采用equals方法去逐一比较,效率必然是一个问题。
此时hashCode方法的作用就体现出来了,当集合要添加新的对象时,先调用这个对象的hashCode方法,得到对应的hashcode值,实际上在HashMap的具体实现中会用一个table保存已经存进去的对象的hashcode值,如果table中没有该hashcode值,它就可以直接存进去,不用再进行任何比较了;如果存在该hashcode值, 就调用它的equals方法与新元素进行比较,相同的话就不存了。这样一来实际调用equals方法的次数就大大降低了。
- 现有两个对象
Dog dog1 = new Dog("小黑","black");
Dog dog2 = new Dog("小黑","black");
虽然这两个对象属性值完全相等,但是他们分别引用着堆内存中不一样的地址,如果不重写Dog类的hashcode
和equals
方法,则他们的equals方法不相同;同样他们的hashcode
值也大概率不相等(这里说大概率是因为,不同的对象,他们的hashcode值可能会相等,但是几率很小)。
这样如果dog1已经在set集合中,现在存入dog2的话,根据上面的判断步骤,首先将dog2的hashcode
值与集合中已经存在的数据的hashcode
值比较,不相等则直接添加,如果相等再进一步判断他们的equals是否相等,不相等则添加。
如果不重写Dog类的hashcode和equals方法,那dog2也会被添加进去,但是他们的属性值完全相等,这样就与set集合元素唯一性相违背。
所以,set集合或者map集合中的key为自定义对象时,要重写该对象的equals和hashcode方法
同样的道理,如果只重写equals方法,或者只重写hashcode方法,这样的两个对象还都是会被添加到集中当中的。
- 那怎么重写equals方法和hashcode方法呢?
一定要确保两个对象的所有字段相同,IDE可以自动生成