HashSet通过HashMap的key保持元素不重复
我们知道HashMap的key是不重复的,且可以含一个null值。而HashSet存储的元素同样是不重复且可含一个null值的。其原因就是:HashSet就是使用HashMap的key值来实现此机制的,而将HashMap的value丢弃。
在源代码中,我们可以看见HashSet有两个这样的属性:
// HashSet将使用该HashMap对象的key保存元素
private transient HashMap<E,Object> map;
// HashMap中value将由此虚拟对象填充,仅占位无意义
// Dummy value to associate with an Object in the backing Map
private static final Object PRESENT = new Object();
构造方法挑几个:
// 最基础的,创建默认HashMap对象传给引用
public HashSet() {
map = new HashMap<>();
}
/* 参数为一个集合,如果该集合大小小于16,则使用16作为HashMap对象的大小;
* 如果大于16,则将集合大小的4/3倍+1作为HashMap对象的大小。
*/
public HashSet(Collection<? extends E> c) {
map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
addAll(c);
}
// 自定义初始容量和加载因子
public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<>(initialCapacity, loadFactor);
}
// 自定义初始容量,使用默认的加载因子:0.75。
/* 请注意如加载因子设置得过小,则集合扩容的情况会大大增多,导致性能低下;
* 而如果加载因子过大,则集合的搜索效率会呈指数上升,性能依旧低下;
* 因此加载因子在0.75已是很良好的值了。如要调整请保持在0.75附近
*/
public HashSet(int initialCapacity) {
map = new HashMap<>(initialCapacity);
}
// 给LinkedHashSet使用的。参数dummy仅仅是为了使本构造方法和上面第三个构造方法区分开来
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<>(initialCapacity, loadFactor);
}
接下来看看HashSet是如何使用HashMap对象来添加元素的:
/* 使用HashMap对象的put方法,以元素作为key,以相同的对象PRESENT作为value。
* 返回值为:如果放入元素已存在,则返回false;如果加入元素不存在,则返回true。
*/
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
而HashSet删除元素也相当有意思:
/* 同样使用HashMap对象的remove方法,
* 返回值为:如果HashSet中有此元素,则删除之并返回true;如果HashSet中无此元素,则返回false。
*/
public boolean remove(Object o) {
return map.remove(o)==PRESENT;
}
因为HashSet使用的是HashMap的key,因此HashSet的特性与HashMap的key相同:
1、元素不重复;
2、元素无序;
3、允许有一个null;
4、非线程安全。