最近在实验室项目开发中,遇到了一个奇怪的问题。现象是同一个对象,在一个HashSet里面存了两份。当时以为是hashcode和equals方法没有写对,但是仔细检查后没有发现错误。仔细debug发现,在HashSet对象中存的同一个对象的两份,其hashcode不同。于是想到也许是对象的hashcode发生了变化。
通过查看HashMap的源码(HashSet的add是用HashMap的put实现的)发现,加入HashSet的对象,其hashcode是在执行add方法的时候进行计算的。所以如果一个对象的hashCode方法中包含可变域,那么将对象加入HashSet后,将其中的某个用于计算hashcode的域改变,然后再次加入HashSet后,便会出现一个对象在HashSet中存在两份的奇怪现象。
下面是一个小示例:
import java.util.HashSet;
import java.util.Set;
public class Main
{
private static class TestClass
{
int field;
public TestClass(int field)
{
this.field=field;
}
public void setField(int field)
{
this.field=field;
}
@Override
public boolean equals(Object obj)
{
if(this==obj)
return true;
if(!(obj instanceof TestClass))
return false;
TestClass testObj=(TestClass)obj;
return field==testObj.field;
}
@Override
public int hashCode()
{
return field;
}
}
public static void main(String[] args)
{
Set<TestClass> testSet=new HashSet<TestClass>();
TestClass obj1=new TestClass(1);
testSet.add(obj1);
System.out.println(testSet);
System.out.println(testSet.contains(obj1));
obj1.setField(2);
System.out.println(testSet);
System.out.println(testSet.contains(obj1));
testSet.add(obj1);
System.out.println(testSet);
System.out.println(testSet.contains(obj1));
}
}
其输出如下:
[Main$TestClass@1]
true
[Main$TestClass@2]
false
[Main$TestClass@2, Main$TestClass@2]
true
可以看到,第一次将对象obj1加入testSet后,testSet中只有一个对象,且contains方法有效。然后将对象obj1中的field值改变,此时testSet的contains便失效了。因为此时obj1的hashcode改变,testSet无法根据hashcode来找到之前的那个对象。然后将obj1再次加入testSet中,此时testSet里面便有同一个对象的两个引用了。
所以上面的现象说明,不要把对象的可变域作为hashcode的计算依据,否则会出现各种意想不到的情况。比如contains失效、remove失效等等。如果把可变对象作为HashMap的key后并改变其域,则会出现明明有一个key-value对,但是却无法使用map的get方法从key获得value的现象。
建议将hashcode使用的域设为final的。