问题描述
将某个对象添加到一个HashSet之后,修改了该对象的属性值,之后再将该对象添加到同一个HashSet中,遍历集合发现存在两个属性值一样的对象,说明去重失败。
public class GeneralTest {
public static void main(String[] args) {
Set<Person> personSet = new HashSet<>();
Person person = new Person("张三", "666");
personSet.add(person);
System.out.println("----1.修改person属性前----");
personSet.forEach(System.out::println);
person.setEmail("123");
System.out.println("----2.修改person属性后----");
personSet.forEach(System.out::println);
System.out.println("集合中是否存在person:" + personSet.contains(person));
personSet.add(person);
System.out.println("----3.再次添加person到Set中----");
System.out.println("集合大小:" + personSet.size());
personSet.forEach(System.out::println);
}
@Data
public static class Person{
private String name;
private String email;
public Person(String name, String email) {
this.name = name;
this.email = email;
}
}
}
----1.修改person属性前----
GeneralTest.Person(name=张三, email=666)
----2.修改person属性后----
GeneralTest.Person(name=张三, email=123)
集合中是否存在person:false
----3.再次添加person到Set中----
集合大小:2
GeneralTest.Person(name=张三, email=123)
GeneralTest.Person(name=张三, email=123)
问题分析
正常来说,HashSet中存放的是对person对象的引用,两次add的是同一个对象,遍历的结果也证实了这一点,但这不是与Set不允许存放相同元素矛盾了吗?
我们知道,HashSet是基于哈希表实现的集合,在想HashSet中添加元素时,会先计算元素的哈希值,然后根据哈希值确定元素在哈希表中的存放位置,如果该位置上已经存在其他元素,则会调用元素的equals方法与已有的元素进行比较,如果两个元素相等,则不允许添加,否则就将新元素添加到哈希表中。
于是我打印了在修改person属性值前后,person的hashCode,结果如下:
----1.修改person属性前----
GeneralTest.Person(name=张三, email=666) hashCode:217837549
----2.修改person属性后----
GeneralTest.Person(name=张三, email=123) hashCode:217832617
集合中是否存在person:false
----3.再次添加person到Set中----
集合大小:2
GeneralTest.Person(name=张三, email=123) hashCode:217832617
GeneralTest.Person(name=张三, email=123) hashCode:217832617
可以看到,在修改person的属性值后,set中person的hashCode已经发生了变化,在这之后再将person重复添加到set中时,通过hashCode找到的在哈希表中的位置和第一次添加时的位置并不相同,因此不会发生哈希碰撞,也就成功将person再次添加进去了。
总结
- 在使用HashSet添加集合元素之后,不要随意修改元素。
- 如果在添加对象前不确定是否已经添加过该对象,可以直接用remove()方法先移除原对象(此时对象的哈希值还未发生变化),再将修改后的对象添加到set中