HashSet 与 TreeSet 的区别与底层实现分析

dm菜鸟编程

于 2024-11-24 09:04:13 发布

阅读量829

点赞数 10

分类专栏： Java中的集合文章标签： java 开发语言

本文链接：https://blog.csdn.net/fulai00/article/details/143860408

版权

Java中的集合专栏收录该内容

7 篇文章

订阅专栏

在 Java 中，HashSet 和 TreeSet 都是常用的集合类，广泛应用于需要无重复元素的场景中。它们的底层数据结构不同，导致它们在性能和功能上有所区别。本文将深入分析它们的实现原理、主要区别，并探讨它们的适用场景，帮助你在开发中做出更合适的选择。

1. HashSet

1.1 底层实现

HashSet 是基于 HashMap 来实现的。每个元素作为 HashMap 的 key 存储，HashSet 通过 HashMap 的 put 方法来实现元素的添加。HashSet 不允许重复的元素，它通过 hashCode() 和 equals() 来判断元素是否已经存在。

public class HashSet<E> extends AbstractSet<E> implements Set<E>, Cloneable, java.io.Serializable {
    private transient HashMap<E, Object> map;
    private static final Object PRESENT = new Object();

    public HashSet() {
        map = new HashMap<>();
    }

    public boolean add(E e) {
        return map.put(e, PRESENT) == null;
    }
}

存储结构：HashSet 底层是一个 HashMap，HashSet 中的元素作为 HashMap 的 key 存储，value 固定为 PRESENT。
元素唯一性：通过 hashCode() 和 equals() 来判断元素是否重复。
无序性：HashSet 中的元素是无序的，即它不保证元素的插入顺序。

1.2 适用场景

HashSet 非常适用于需要快速查找、插入且不关心元素顺序的场景。例如，去重操作、集合运算等。它的 add 方法时间复杂度为 O(1)，因此在元素数量较大时，性能相对较高。

2. TreeSet

2.1 底层实现

TreeSet 是基于 TreeMap 来实现的。TreeMap 是一个基于红黑树的数据结构，TreeSet 继承了 TreeMap，并将 value 设为固定的 PRESENT。TreeSet 中的元素是有序的，按照元素的自然顺序或者指定的比较器进行排序。

public class TreeSet<E> extends AbstractSet<E> implements NavigableSet<E>, Cloneable, java.io.Serializable {
    private transient NavigableMap<E, Object> m;
    private static final Object PRESENT = new Object();

    public TreeSet() {
        this(new TreeMap<E, Object>());
    }

    public boolean add(E e) {
        return m.put(e, PRESENT) == null;
    }
}

存储结构：TreeSet 底层是 TreeMap，通过红黑树结构实现排序。TreeSet 中的 key 被用于排序。
元素唯一性：通过 compareTo() 或者 Comparator 来判断元素是否重复。
有序性：TreeSet 会根据元素的自然顺序或者传入的比较器来排序元素，因此元素是有序的。

2.2 适用场景

TreeSet 适用于需要存储有序集合的场景，尤其是当你需要根据元素的大小关系进行排序时。此外，TreeSet 提供了一些额外的功能，比如 NavigableSet 接口中的方法（如 lower()、ceiling() 等），可以方便地进行基于排序的查询操作。由于 TreeSet 基于红黑树，其插入和查找的时间复杂度为 O(log n)，适用于需要排序和快速查找的场景。

3. HashSet 与 TreeSet 的区别

特性	HashSet	TreeSet
底层数据结构	基于 `HashMap` 实现	基于 `TreeMap` 实现
排序方式	无序	有序（默认按元素的自然顺序排序）
元素唯一性	根据 `hashCode()` 和 `equals()` 判断重复	根据 `compareTo()` 或 `Comparator` 判断重复
插入顺序	不保证插入顺序	保证按照元素的自然顺序或指定的顺序排序
时间复杂度	`add()` 方法的时间复杂度是 O(1)	`add()` 方法的时间复杂度是 O(log n)
自定义对象使用	存储自定义对象时需要重写 `hashCode()` 和 `equals()`	存储自定义对象时需要实现 `Comparable` 或传入 `Comparator`

3.1 无序与有序

HashSet 中的元素是无序的，因此无法保证迭代时元素的顺序。TreeSet 则按照元素的自然顺序（或者自定义的顺序）进行排序，因此在遍历 TreeSet 时，元素会按照排序的顺序输出。

3.2 适用场景的选择

HashSet 适用于：只关心元素的唯一性、性能要求高、且对顺序没有要求的场景。
TreeSet 适用于：需要对元素进行排序、或者需要基于排序进行快速查找的场景。

4. 总结

HashSet 和 TreeSet 都是 Java 中常用的集合类，但它们的底层实现和特性有所不同。HashSet 适用于不关心元素顺序且需要快速操作的场景，而 TreeSet 则适用于需要保证元素有序且能够进行排序相关操作的场景。在选择使用这两者时，开发者应根据实际需求，选择最合适的集合类型。