HashSet源码解析

最新推荐文章于 2025-06-25 16:39:32 发布

原创最新推荐文章于 2025-06-25 16:39:32 发布 · 263 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#java

1.走进HashSet

HashSet是Collection下的一个集合框架类，其特征是无序、唯一，大家都会使用HashSet来进行业务操作和作为去重的工具，那你知不知道里面具体的实现和代码？你知道HashSet和ArrayList的查找效率哪一个更好吗？让我们带着自己的疑问往下看。

2.它继承或实现哪些类呢？

public class HashSet<E>
    extends AbstractSet<E>
    implements Set<E>, Cloneable, java.io.Serializable

AbstractSet 是实现了一些较为通用的方法

Set接口规范了Set集合共有的方法，并要求其子类进行实现，如size(),isEmpty(),contains(Object o), add(E e),remove(Object o)等等方法

最上层的接口类是Collection,Collection下有Set，List，Queue等。也说明了其能互相转换为其他类型。

3.看看常量和构造方法

// 有些人看起来很奇怪，为什么写着hashMap?
// HashSet确实是使用hashMap来实现的，操作都是针对key的，value的部分存储一个虚拟值。
private transient HashMap<E,Object> map;

// 映射map中关联的虚拟值， static final 代表着每一个key所映射的值都是同一个。节省没必要的内存空间
private static final Object PRESENT = new Object();

// 无参构造是初始化一个hashMap
public HashSet() {
   map = new HashMap<>();
}

// 传入的参数是构建hashMap所需的，initialCapacity 初始化容量，loadFactor 负载因子
public HashSet(int initialCapacity, float loadFactor) {
   map = new HashMap<>(initialCapacity, loadFactor);
}

4.插入，删除

// 增加
public boolean add(E e) {
    return map.put(e, PRESENT)==null;
}
// 删除
public boolean remove(Object o) {
    return map.remove(o)==PRESENT;
}

5.遍历

HashSet的遍历实际上就是对HashMap的Key进行遍历

public Iterator<E> iterator() {
   return map.keySet().iterator();
}

实际上等同于一个链表，不像数组那样可以指定下标寻找。

若是不知道下标的情况下，数组和set都是需要整个遍历，直至找到内容。

6.contains()

public boolean contains(Object o) {
    return map.containsKey(o);
}

hashSet的contains方法实际使用hashMap的containsKey方法

    final Node<K,V> getNode(int hash, Object key) {
        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                return first;
            if ((e = first.next) != null) {
                if (first instanceof TreeNode)
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        return null;
    }

实际上，走回了HashMap的get方法了，在理想状态下（hashMap的数组每一个元素没有遭遇hash冲突，链表中只有一个元素）是比ArrayList 的contains方法更快。ArrayList 的contains 方法是遍历整个数组直至找到值一样的元素才会停下来。而hashMap的contains可以根据计算hash值，直接定位到具体位置。