一、前言
HashSet的基本特点是元素不可重复,但是不能保证元素的顺序;同时也是不同步的,所以多线程常见会存在线程安全问题。在开发过程中,HashSet是一个不错的去重工具。那是具体的实现机制是怎样的呢?马上开始揭晓。
二、源码解读
特性
HashSet继承了集合框架AbstractSet<E>,保证了集合的基本特征,实现了接口Set包含了基本集合操作,实现了接口Cloneable支持克隆,实现了Serializable支持序列化。
public class HashSet<E>
extends AbstractSet<E>
implements Set<E>, Cloneable, java.io.Serializable
变量
//Set的实现原理
private transient HashMap<E,Object> map;
//集合中元素的映射值,不可变,所以所有元素的都是映射值相同
private static final Object PRESENT = new Object();
构造方法
五个构造方法,前四个都是用力构建单纯哈希表,最后一个仅是构造函数由LinkedHashSet使用
//无参构造函数HashSet的实现机制就是HashMap
public HashSet() {
map = new HashMap<>();
}
//构造包含指定元素集合的set,map的初始化容量:最小为16,最大等于加入集合大小的除0.75+1
//然后加集合加入到map中
public HashSet(Collection<? extends E> c) {
map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
addAll(c);
}
//构造一个指定大小和负载系数的Set集合(map)
public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<>(initialCapacity, loadFactor);
}
//构造一个指定大小Set,无负载系统
public HashSet(int initialCapacity) {
map = new HashMap<>(initialCapacity);
}
//构造函数仅由LinkedHashSet使用
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<>(initialCapacity, loadFactor);
}
主要方法
从下面的方法中,可以看出对Set集合操作实际上是对HashMap的操作,只是key不同,value相同。
//迭代
public Iterator<E> iterator() {
return map.keySet().iterator();
}
//集合大小
public int size() {
return map.size();
}
//判断集合是否为空
public boolean isEmpty() {
return map.isEmpty();
}
//集合是否包含某元素
public boolean contains(Object o) {
return map.containsKey(o);
}
//添加元素,实际只是添加key,value只是没有含义的对象
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
//删除元素,实际是更加key删除元素
public boolean remove(Object o) {
return map.remove(o)==PRESENT;
}
//清除元素
public void clear() {
map.clear();
}
//1.8新增的方法并行迭代
public Spliterator<E> spliterator() {
return new HashMap.KeySpliterator<E,Object>(map, 0, -1, 0, 0);
}
HashSet是如何实现元素不可重复的
通过源码已知,Hash本质上就是HashMap,HashSet的元素实际上就是HashMap的key。最终要探究的其实是HashMap中的key为什么不能重复? 在通过查询HashMap中的put的方法可以发现,在put元素时首先会计算key的hash值,通过hasn值来判断元素加入的位置,同时会与已存在元素的hash比较,如果相等,继续通过equas()比较hash值相同的两个对象是否真的相同,如果仍然相同则不允许插入。
三、总结
HashSet的特点:
- 元素不可重复且无序,元素可为null
- 非同步,不能线程安全
- 实现机制是HashMap
备注:JDK版本:1.8.0_241