Set是不包括重复元素,最多只有一个null的单值集合,使用场合就是要求集合中不包含有重复元素。
一、HashSet数据结构
HashSet是基于HashMap实现的Set,其内部数据结构跟HashMap(点击此处查看HashMap的介绍)一样,HashSet的值就是HashMap的key,对HashSet的操作其实就是对HashMap的key进行操作。
二、类的定义
public class HashSet<E>
extends AbstractSet<E>
implements Set<E>, Cloneable, java.io.Serializable
{
// 内部组合了HashMap,对HashSet的操作由该HashMap完成
private transient HashMap<E,Object> map;
// HashMap的value,全部key共用一个value,减少对象的创建
private static final Object PRESENT = new Object();
}
public abstract class AbstractSet<E> extends AbstractCollection<E> implements Set<E> {}
抽象类AbstractSet定义了子类的通用方法,其中就包括了equals(),hashCode()方法。HashSet的类继承关系如下所示,其跟ArrayList的继承关系特别相像。
三、构造函数
// 默认构造器,直接创建一个HashMap
public HashSet() {
map = new HashMap<>();
}
// 把集合参数的元素加到HashSet
public HashSet(Collection<? extends E> c) {
map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
addAll(c);
}
// 指定HashSet的初始容量,即指定HashMap哈希桶的大小
public HashSet(int initialCapacity) {
map = new HashMap<>(initialCapacity);
}
// 指定HashSet的初始容量和负载因子,即指定HashMap哈希桶的大小和负载因子
public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<>(initialCapacity, loadFactor);
}
// 增加了一个boolean参数,主要是用作重载构造器,map赋值为LinkedHashMap。
// 该构造器主要给子类LinkedHashSet使用
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<>(initialCapacity, loadFactor);
}
四、存储的实现
HashSet的add,clear,remove操作全部都是基于对HashMap的操作,有一点需要注意的是没有get方法。
public boolean add(E e) {
// 把添加的元素作为key加入到HashMap中,value都是同一个PRESENT
return map.put(e, PRESENT)==null;
}
public void clear() {
// 清除操作是调用HashMap的clear方法
map.clear();
}
public boolean remove(Object o) {
// 删除操作也是调用HashMap的方法
return map.remove(o)==PRESENT;
}
public Iterator<E> iterator() {
// 迭代器是调用HashMap的keySet的迭代器
return map.keySet().iterator();
}
五、总结
- HashSet内部没有重复的元素,最多只有一个null值,故其使用场合是要求集合中不能有重复对象的情景。
- HashSet是基于HashMap实现的,对HashSet的操作其实就是对HashMap的操作,HashMap的key存储的就是HashSet的值。
- 如果是自定义的元素需要自己实现equals()和hashCode()方法。