1.走进HashSet
HashSet是Collection下的一个集合框架类,其特征是无序、唯一,大家都会使用HashSet来进行业务操作和作为去重的工具,那你知不知道里面具体的实现和代码?你知道HashSet和ArrayList的查找效率哪一个更好吗?让我们带着自己的疑问往下看。
2.它继承或实现哪些类呢?
public class HashSet<E>
extends AbstractSet<E>
implements Set<E>, Cloneable, java.io.Serializable
AbstractSet 是实现了一些较为通用的方法
Set接口规范了Set集合共有的方法,并要求其子类进行实现,如size(),isEmpty(),contains(Object o), add(E e),remove(Object o)等等方法
最上层的接口类是Collection,Collection下有Set,List,Queue等。也说明了其能互相转换为其他类型。
3.看看常量和构造方法
// 有些人看起来很奇怪,为什么写着hashMap?
// HashSet确实是使用hashMap来实现的,操作都是针对key的,value的部分存储一个虚拟值。
private transient HashMap<E,Object> map;
// 映射map中关联的虚拟值, static final 代表着每一个key所映射的值都是同一个。节省没必要的内存空间
private static final Object PRESENT = new Object();
// 无参构造是初始化一个hashMap
public HashSet() {
map = new HashMap<>();
}
// 传入的参数是构建hashMap所需的,initialCapacity 初始化容量,loadFactor 负载因子
public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<>(initialCapacity, loadFactor);
}
4.插入,删除
// 增加
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
// 删除
public boolean remove(Object o) {
return map.remove(o)==PRESENT;
}
5.遍历
HashSet的遍历实际上就是对HashMap的Key进行遍历
public Iterator<E> iterator() {
return map.keySet().iterator();
}
实际上等同于一个链表,不像数组那样可以指定下标寻找。
若是不知道下标的情况下,数组和set都是需要整个遍历,直至找到内容。
6.contains()
public boolean contains(Object o) {
return map.containsKey(o);
}
hashSet的contains方法实际使用hashMap的containsKey方法
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
if ((e = first.next) != null) {
if (first instanceof TreeNode)
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}
实际上,走回了HashMap的get方法了,在理想状态下(hashMap的数组每一个元素没有遭遇hash冲突,链表中只有一个元素)是比ArrayList 的contains方法更快。ArrayList 的contains 方法是遍历整个数组直至找到值一样的元素才会停下来。而hashMap的contains可以根据计算hash值,直接定位到具体位置。