Java集合之HashSet源码剖析(jdk1.8)
1、简介
HashSet是Set接口下常用的实现类。
HashSet的实现主要使用HashMap的key来满足Set的特性:不重复,并且也是无序的。
HashSet的继承图谱如下:
实现的都是些基础接口。
2、源码解析
HashSet的源码内容不多,主要部分都是调用HashMap实现得。
1、属性
主要属性就两个:
//底层是HashMap,只使用key
private transient HashMap<E,Object> map;
//用于充当map的value,毕竟map是需要有value的
private static final Object PRESENT = new Object();
2、构造方法
五个构造方法,可以看到都是调用的HashMap构造函数,最后那个调用的是LinkedHashMap的构造方法。
public HashSet() {
map = new HashMap<>();
}
public HashSet(Collection<? extends E> c) {
map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
addAll(c);//父类的方法
}
public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<>(initialCapacity, loadFactor);
}
public HashSet(int initialCapacity) {
map = new HashMap<>(initialCapacity);
}
//这个构造方法是给LinkedHashSet使用的
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<>(initialCapacity, loadFactor);
}
3、重要方法
因为是调用的HashMap来实现的,所以主要方法基本都和HashMap相关。
//迭代器
public Iterator<E> iterator() {
return map.keySet().iterator();
}
public int size() {
return map.size();
}
public boolean isEmpty() {
return map.isEmpty();
}
//Set没有索引,所以直接判断是否在容器中
public boolean contains(Object o) {
return map.containsKey(o);
}
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
public boolean remove(Object o) {
return map.remove(o)==PRESENT;
}
public void clear() {
map.clear();
}
}
没了。。。。真的没了。
3、总结
(1)HashSet底层基于HashMap,HashMap的key是不重复的且无序。
(2)阿里手册上有说,使用java中的集合时要自己指定集合的大小,假如,我们预估HashMap要存储n个元素,那么,它的容量就应该指定为((n/0.75f) + 1),如果这个值小于16,那就直接使用16得了。
初始化时指定容量是为了减少扩容的次数,提高效率。
(3)HashSet线程不安全。
(4)HashSet中允许有一个null,因为HashMap中的key允许有一个null.