类介绍(注释)
- HashSet是基于HashMap、Set接口的实现,它不保证元素的遍历顺序。
add、remove、contains、size
方法,时间复杂度是O(1)
- HashSet是非线程安全的,并发出错时,会快速失败,抛出
ConcurrentModificationException
常用方法源码
构造函数
无参构造函数
// 内部组合的HashMap
private transient HashMap<E,Object> map;
public HashSet() {
// 创建了一个HashMap,采用默认的load factor和capacity
map = new HashMap<>();
}
有参构造函数
public HashSet(Collection<? extends E> c) {
// 计算capacity
map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
// 将所有元素加入
addAll(c);
}
以上Math.max((int) (c.size()/.75f) + 1, 16)
,即是计算对应HashMap的capacity的代码。
如果(c.size()/.75f) + 1 < 16
,则指定capacity为16,反之,就使用(c.size()/.75f) + 1
。
HashMap 扩容的阈值,是:size * 0.75,一旦达到阀值就会扩容(resize),此处用c.size()/0.75f + 1
来表示初始化的值,这样使我们期望的大小值正好比扩容的阀值大 1,就不会扩容。
add(添加、set去重原理)
这里是直接调用HashMap的put方法,以入参e为key,以共享的值 PRESENT 为value。这种方式,使用的是组合的思想(一种典型的复用思想),即在内部,维护一个HashMap。add
方法,返回的是boolean类型。源码中207~218的对该方法及返回值的解释:
- 当前元素不在该set中时,会往对应map中,进行put元素e为key,空值PRESENT为value的操作,并返回true。
- 当前元素已经在该set中,调用add方法,将在底层的map中,覆盖key为元素e所对应的值(其实都是PRESENT),并返回false。(同时,这也是为什么HashSet、TreeSet中可以对元素去重的原理)
// map中使用的值
private static final Object PRESENT = new Object();
public boolean add(E e) {
// 直接调用HashMap的put方法,put方法在没有找到以e为key的对象时,才会返回null
return m.put(e, PRESENT)==null;
}