对HashSet不含重复元素理解
在网上寻找ArrayList和HashSet的在处理大数据的效率时看到HastSet的效率优于ArrayList,又看到HastSet的特点有不重复的特点,就好奇查了一下他是怎么去重的,参考网上的一个方法,我自己也写了一个类,发现对于使用@Data注解的类即使add进去相同的数据HashSet也是去重过了的,
@Data
public class test {
private String x;
private String y;
public test(String x1, String y1) {
this.x=x1;
this.y=y1;
}
public static void main(String[] args) {
test test1=new test("a","b");
test test2=new test("a","b");
HashSet hashSet1=new HashSet();
hashSet1.add(test1);
hashSet1.add(test2);
System.out.println(hashSet1.size());
}
}
打印出来的结果只有一个
但是对于不使用@Data注解,两次传入相同的值,HashSet里竟然出现没有去重的情况. 一开始我一直以为是使用了构造函数的原因,以为只要将值set进去就不一样了,但事实并非如此.
因为hashCode是jdk根据对象的地址或者字符串或者数字算出来的int类型的数值,在@Data注解中重写了HashCode和equals,主要判断的方法就是当集合要添加新的对象时,先调用这个对象的hashCode方法,得到对应的hashcode值,实际上在HashMap的具体实现中会用一个table保存已经存进去的对象的hashcode值,如果table中没有该hashcode值,它就可以直接存进去,不用再进行任何比较了;如果存在该hashcode值, 就调用它的equals方法与新元素进行比较,相同的话就不存了,不相同就散列其它的地址.而@Data中正是因为重写了EqualsAndHashCode.
public class test {
private String x;
private String y;
public test(String x1, String y1) {
this.x=x1;
this.y=y1;
}
@Override
public boolean equals(Object param)
{
test params= (test) param;
if (x==params.x&&y==params.y)
return true;
else
return false;
}
public int hashCode()
{
return new String(x).hashCode();
}
public static void main(String[] args) {
test test1=new test("a","b");
test test2=new test("a","b");
HashSet hashSet1=new HashSet();
hashSet1.add(test1);
hashSet1.add(test2);
System.out.println(hashSet1.size());
}
}
最后不使用@data注解重写后的结果是1个,没有重写结果就是2个.
主要原还是因为重写了HashCode方法,这样生成的hashCode值相同的话进行比较,值相同覆盖,不同则存入.