1. Set
Set一种存储不重复元素的容器。也就是说,Set容器中的元素,不可以出现一个元素equals另一个元素,并且最多也只能有一个元素为null。
Set家族较为常见的实现类是HashSet和LinkedHashSet。本文将介绍这两个类的源码实现(JDK8)。
2. HashSet
HashSet无法保证集合的迭代顺序,并且也无法保证集合中元素的排列顺序随着时间的推移保持不变。
HashSet的实现方式并非线程安全的,在多线程环境下,我们需要在外部进行同步操作。
2.1 继承关系和成员属性
HashSet继承自抽象类AbstractSet,实现了Set接口等。
HashSet中用于存储数据的数据结构是HashMap。
实际上,HashSet是一个简化版的HashMap,HashSet的所有元素都是HashMap的key,不存储value。
public class HashSet<E>
extends AbstractSet<E>
implements Set<E>, Cloneable, java.io.Serializable
{
static final long serialVersionUID = -5024744406713321676L;
//存储数据
private transient HashMap<E,Object> map;
//此Object对象作为HashMap中所有key的value,没有任何意义
private static final Object PRESENT = new Object();
}
因为HashMap中存放的是键值对key-value,加入HashSet容器中的元素作为内部HashMap的key,使用一个不没有意义的Object对象作为所有key的value,类属性PRESENT起到这个作用。
由于HashSet是简化版的HashMap,其内部几乎所有的方法都调用了HashMap的方法,因此,涉及到HashMap的源码时,本文不会具体展开阐述。
如果想了解的话,可以参考博文https://blog.csdn.net/Longstar_L/article/details/111433435。
2.2 构造器
(1)空参构造器,新建了一个空的HashMap,使用了默认的初始容量16和装载因子0.75。
public HashSet() {
map = new HashMap<>();
}
(2)设置初始容量的构造器,实际上设置的是内部HashMap的初始容量,使用默认的装载因子0.75。
public HashSet(int initialCapacity) {
map = new HashMap<>(initialCapacity);
}
(3)设置初始容量和装载因子的构造器,实际上设置的是内部HashMap的这两个参数。
public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<>(initialCapacity, loadFactor);
}
(4)设置初始容量和装载因子的构造器,dummy参数只用于使该构造器区别于其他构造器。这个构造器主要给HashSet的子类LinkedHashSet使用,这里创建的是一个LinkedHashMap。
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<>(initialCapacity, loadFactor);
}
(5)初始时就将容器c中的所有元素添加到本容器中的构造器,装载因子设置为0.75。初始容量足以存放当前要存放的元素数,设置为c.size()/0.75+1和16之间的最大值,即容量至少为16。
public HashSet(Collection<? extends E> c) {
map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
addAll(c);
}
2.3 添加元素
add(E)方法将一个元素添加到HashSet内部的HashMap中。调用HashMap的put方法,将当前元素作为key,类属性PRESENT作为value。
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
2.4 删除元素
调用HashMap的remove方法,当前要删除的元素作为key,如果删除成功,会返回这个key对应的value,即PRESENT对象。因此,如果返回了PRESENT对象,则说明删除成功。
public boolean remove(Object o) {
return map.remove(o)==PRESENT;
}
2.5 查找元素
调用HashMap的containsKey方法,找到返回true,没找到返回false。
public boolean contains(Object o) {
return map.containsKey(o);
}
2.6 迭代器
使用HashMap的keySet的迭代器。
public Iterator<E> iterator() {
return map.keySet().iterator();
}
3. LinkedHashSet
LinkedHashSet与HashSet的区别是,其内部保存的是一个LinkedHashMap。这样可以根据元素的添加顺序或者访问顺序来遍历容器。
LinkedHashSet继承了HashSet,其调用了HashSet的**HashSet(int initialCapacity, float loadFactor, boolean dummy)**构造器以在内部创建一个LinkedHashMap。
将加入的元素,作为LinkedHashMap的key;无意义的Object对象作为所有key的value。
接下来,LinkedHashSet的所有操作都可以调用LinkedHashMap的接口了。
4. 小结
①HashSet是一种简化版的HashMap,其内部通过HashMap来保存元素。将要保存的元素对象作为map的key,用于共享的无意义的Object对象作为value。
②LinkedHashMap是一种简化版的LinkedHashMap,其内部通过LinkedHashMap来保存元素。将要保存的元素对象作为map的key,用于共享的无意义的Object对象作为value。
③由于Set中所有的元素都要作为Map的key使用,因此,Set中的所有元素都不可以重复。