深入源码分析HashSet-CSDN博客

本文链接：https://blog.csdn.net/canot/article/details/51240251

本文深入探讨HashSet的源码，揭示其依赖于HashMap的实现方式。HashSet内部利用HashMap存储元素，其中key保存集合元素，value为固定对象PRESENT。通过分析，我们发现HashSet的添加操作遵循HashMap的冲突解决策略，即通过hashCode()和equals()方法判断元素是否存在，强调重写这两个方法的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前面我们花了一定的篇幅学习了HashMap的一些底层原理，以及简单了解了HashSet和HashMap两种集合的渊源，现在我们从HashSet源码入手，来学习HashSet更细节的地方。

对于HashSet而言，它是基于HashMap实现的。HashSet底层采用HashMap来保存元素，因此HashSet底层其实比较简单。

package java.util;

public class HashSet<E>
    extends AbstractSet<E>
    implements Set<E>, Cloneable, java.io.Serializable
{
    static final long serialVersionUID = -5024744406713321676L;

    // HashSet是通过map(HashMap对象)保存内容的
    private transient HashMap<E,Object> map;

    // 定义一个虚拟的Object PRESENT是向map中插入key-value对应的value
    // 因为HashSet中只需要用到key，而HashMap是key-value键值对；
    // 所以，向map中添加键值对时，键值对的值固定是PRESENT
    private static final Object PRESENT = new Object();

    // 默认构造函数 底层创建一个HashMap
    public HashSet() {
        // 调用HashMap的默认构造函数，创建map
        map = new HashMap<E,Object>();
    }

    // 带集合的构造函数
    public HashSet(Collection<? extends E> c) {
        // 创建map。
        // 为什么要调用Math.max((int) (c.size()/.75f) + 1, 16)，从 (c.size()/.75f) + 1 和 16 中选择一个比较大的树呢？        
        // 首先，说明(c.size()/.75f) + 1
        //   因为从HashMap的效率(时间成本和空间成本)考虑，HashMap的加载因子是0.75。
        //   当HashMap的“阈值”(阈值=HashMap总的大小*加载因子) < “HashMap实际大小”时，
        //   就需要将HashMap的容量翻倍。
        //   所以，(c.size()/.75f) + 1 计算出来的正好是总的空间大小。
        // 接下来，说明为什么是 16 。