今天在梳理java集合类的基本用法过程中,中间出了一点点小岔子。什么呢?HashSet集合不能包含存储重复元素---》那么元素之间是否重复,HashSet怎么去判断的呢?
HashSet使用HASH算法来存储集合中的元素,具有良好的存取和查找性能。
HashSet使用HASH算法来存储集合中的元素,具有良好的存取和查找性能。
大概过程是这样:HashSet在添加一个元素时,会调用该对象的hashCode()方法来得到该对象的hashCode值,与遍历到的每个元素的hashCode比较,如果不相等则直接添加;若hashCode的值一样,则继续用该元素的equals()方法比较(这里要强调一下,是重写后的equals()方法,与之比较的元素作为参数),如果返回值一样拒绝添加,不一样的话就将该对象添加到其他内存地址(重新计算出不一样的hashCode)。
import java.util.*;
//A类没有重写hashCode()方法,在new两个对象时,hashCode肯定是不同的,所以两个A都会直接被加进去
class A{
public boolean equals(Object obj){
return true;
}
}
//B类重写了hashCode()且都返回1,第一个B因为遍历不会碰到相同的hashCode‘1’值直接添加,而第二个就得用equals方法去比较了。由于没有去重写equals()方法,new出来的两个对象用equals()方法比较也不可能相同。
注:这里想多说一点,我们都知道,‘==’比较两个引用是否指向同一个对象,‘equals’比较两个对象的内容。当然这里的equals()方法是被重写过才能去比较内容相等的吧(当然基本数据类型直接用==,string为引用数据类型,调用String类本身重写的equals方法)。
不管怎样,请看:
eg.
User a = new User();
User b = new User();
System.out.println(a == b);
System.out.println(a.equals(b)); //还未重写equals方法
上面两行代码打印出来的都是false,因为两个引用对象a和b指向的是不同对象,只有指向相同的对象才会返回true
另外,在Object类的equals方法如下:
public boolean equals(Object obj) {
return (this == obj);
}
由此可以看出,为重写的equals方法实现的功能与’==’一样
所以当我们调用equals方法的时候,要重写 (蓝瘦香菇)
//那么就能解释了,没有去重写equals()方法,你new出来的两个对象它就是不可能相同的。new一个对象就会给它分配不同的地址。那既然不相同,第二个B也被加进去了。
class B{
public int hashCode(){
return 1;
}
}
//到了C类了,那就不一样了。添加第一个C的时候,hashCode跟第一个B一样继续用重写的equals()方法,哇,返回true了,HashSet就认为他们是相等的,抛弃吧。第二个C,呀,我的hashCode为2,就跟你们不一样,故直接加入。
class C{
public static int count = 0;
public int a;
public C(){
count++;
a = count;
}
public int hashCode(){
return a;
}
public boolean equals(Object obj){
return true;
}
}
public class TestHashSet {
public static void main(String[] args) {
Set set = new HashSet();
set.add(new A());
set.add(new A());
set.add(new B());
set.add(new B());
C c1 = new C();
C c2 = new C();
set.add(c1);
set.add(c2);
System.out.println(c1.hashCode());
System.out.println(c2.hashCode());
System.out.println(set);
}
}
result :
1
2
[B@1, B@1, C@2, A@5f2e712f, A@1043fb68]
所以,结果毫不犹豫的就是这样。这就是为什么HashSet添加元素时要重写这两个方法的原因了。