Set最大的特性就是不允许在其中存放的元素是重复的。
根据这个特点,我们就可以使用Set 这个接口来实现前面提到的关于商品种类的存储需求。Set 可以被用来过滤在其他集合中存放的元素,从而得到一个没有包含重复元素的集合。
1.HashSet类
在set类型的集合中,如何判断元素是否重复呢,这就需要使用Object.equals方法,但如果元素很多了,添加一个新元素时,比较的次数 就很多,例如已经有100个元素了,添加第101个元素时,就要和前面的元素比较100次,效率很低。
hasCode实际上是返回的对象存储的物理地址
HashSet类按照哈希算法来存取对象,当向集合中加入一个新对象时,会调用对象的HashCode()方法得到对象的哈希码,然后根据这个码计算出对象在集合中存储的位置。
不能保证元素在集合中的排列顺序,可能与添加顺序不同或发生变化。
HashSet判断两个元素相等的标准时:HashSet在存储元素的时候,是先查看两个对象的哈希值是否一样的,如果哈希值是一样,再调用元素对象的equals方法,查看两个对象的内容是否一样。
如果没有重写hashCode()方法:
import java.util.HashSet;
//重写对象的equal()方法与hashCode()方法
class R{
int count;
public R(int count){
this.count = count;
}
public String toString(){
return "R[count:" + count +"]";
}
}
public class HashSetTree {
public static void main(String[] args) {
HashSet<R> hs = new HashSet<R>();
hs.add(new R(5));
hs.add(new R(10));
hs.add(new R(20));
hs.add(new R(20));
System.out.println(hs);
java.util.Iterator<R> it = hs.iterator();
R first = it.next();
first.count = 5;
System.out.println(hs);
hs.remove(new R(5));
System.out.println(hs);
hs.remove(new R(5));
System.out.println(hs);
hs.remove(new R(20));
System.out.println(hs);
}
}
所有事物输出结果都是:[R[count:5], R[count:20], R[count:20], R[count:10]],这是因为每次新new一个对象,它产生的哈希码都是不同的,所以会添加重复的元素。
建议:自定义对象,一定要重写hashCode和equals两个方法
如果不重写,则默认的本地方法hashCode【OS来产生】会产生值都不一样的hashCode,即使内容重复的元素也会被添加到HashSet中,无法保证元素的唯一性。
重写hashCode和equals的时候,常犯的错误:
[1]. 子类重写hashCode的时候,将方法名写错,写成hasCode
[2]. 子类重写equals的时候,将参数传错,本来应该是public boolean equals(Object obj){}却写成了public boolean equals(自定义类型自定义类型引用)。这样集合框架的底层不会调用这个重载的方法。
[3].为了保证HashSet能正常工作,要求当两个对象用equals比较相等时,hashCode也要相等,否则就会有可能加入两个相同的项。如果equals比较相等,但hashCode不相等,hashSet会把这两个对象存在不同的位置,可以添加成功,但与set集合的规则相冲。如果equals比较不相等,但hashCode相等,则HashSet试图把他们存在一个位置,会用链式结构来存储,导致性能下降。
代码
package com.cn;
import java.util.HashSet;
//重写对象的equal()方法与hashCode()方法
class R{
int count;
public R(int count){
this.count = count;
}
public String toString(){
return "R[count:" + count +"]";
}
public boolean equals(Object obj){
if(this == obj){
return true;
}
if(obj == null){
return false;
}
if(obj.getClass() == this.getClass()){
R r = (R)obj;
return this.count == r.count;
}
return false;
}
public int hashCode(){
return this.count;
}
}
public class HashSetTree {
public static void main(String[] args) {
HashSet<R> hs = new HashSet<R>();
hs.add(new R(5));
hs.add(new R(10));
hs.add(new R(20));
hs.add(new R(20));
System.out.println(hs);//输出结果:[R[count:20], R[count:5], R[count:10]]
java.util.Iterator<R> it = hs.iterator();
R first = it.next();
first.count = 5;
System.out.println(hs);//输出结果:[R[count:5], R[count:5], R[count:10]]
hs.remove(new R(5));
System.out.println(hs);//输出结果:[R[count:5], R[count:10]]
hs.remove(new R(5));
System.out.println(hs);//输出结果:[R[count:5], R[count:10]]
hs.remove(new R(20));
System.out.println(hs);//输出结果:[R[count:5], R[count:10]]
}
}
从上面的程序可以看出,如果改变了Set集合中的某个元素,但是存储这个元素的hashCode值不会改变,元素改变之后,HashSet依然可以正常输出,但是排序混乱,如果试图删除该元素时,也会导致他无法删除,因为该元素所处位置的元素值与哈希码是不对应的。
总结:把对象添加到HashSet中之后,尽量不要修改集合元素中参与计算hashCode()与equals()的属性,否则将导致HashSet无法正确操作这些元素。
- LinkedHashSet类
按照元素集合里的添加顺序来访问集合中的元素。