1. 什么是 TreeSet?
1.1. 集合的基本概念
在开始介绍 TreeSet
之前,我们先来回顾一下集合的基本概念。
集合是 Java 编程中常用的数据结构之一,它用于存储一组对象。集合通常分为两大类:
- 有序集合(Ordered Collection):其中的元素按照某种顺序排列,可以是添加顺序、自然顺序或自定义顺序。
- 无序集合(Unordered Collection):其中的元素没有明确定义的顺序。
集合可以用于存储不同类型的数据,例如整数、字符串、对象等。在使用集合时,我们通常关心以下几个方面的问题:
- 唯一性:集合是否允许重复元素。
- 有序性:集合中的元素是否有顺序。
- 性能:在集合中执行常见操作的性能,如添加、删除、查找等。
1.2. TreeSet 的定义
TreeSet
是 Java 集合框架中的一种有序集合,它实现了 Set
接口,因此具有不允许重复元素的特性。与 HashSet
不同,TreeSet
使用红黑树数据结构来存储元素,这使得元素在集合中保持有序。
这里需要理解两个主要特性:
- 有序性(Order):
TreeSet
中的元素按照自然排序(元素的自然顺序)或者指定的排序方式(通过比较器)排列。这意味着您可以遍历TreeSet
得到的元素是按照一定的顺序排列的。 - 唯一性(Uniqueness):与
HashSet
一样,TreeSet
也保证元素的唯一性,不允许重复元素。
TreeSet 的内部实现
-
红黑树属性:
- 每个节点都有一个颜色属性,可以是红色或黑色。
- 根节点是黑色的。
- 每个叶子节点(NIL 节点,在
TreeSet
的实现中可能不显式表示)是黑色的。 - 如果一个节点是红色的,则它的两个子节点都是黑色的。
- 对于每个节点,从该节点到其所有后代叶子节点的简单路径上,均包含相同数目的黑色节点。
-
节点结构:
TreeSet
的内部节点通常包含一个键(key)、颜色信息、左右子节点的引用以及父节点的引用(在某些实现中可能不包括父节点的引用)。 -
插入操作:
当向TreeSet
中插入一个元素时,红黑树会进行一系列旋转和重新着色操作来保持其平衡性。这些操作包括颜色翻转、左旋和右旋。 -
删除操作:
删除操作可能比插入操作更复杂,因为需要处理更多的情况来保持树的平衡。在删除节点后,可能需要通过一系列旋转和重新着色操作来修复树。 -
查找操作:
由于红黑树是一个二叉搜索树,所以查找操作可以通过从根节点开始并沿树向下搜索来完成。在每一步中,都会检查当前节点的键是否与目标键相等,或者是否小于或大于目标键,然后根据比较结果向左或向右子树移动。 -
排序和唯一性:
由于TreeSet
使用红黑树作为其内部数据结构,并且红黑树是一个排序树,因此TreeSet
中的元素总是按照其自然顺序(如果元素实现了Comparable
接口)或根据提供的Comparator
进行排序。同时,由于红黑树的性质保证了没有重复的键,因此TreeSet
中的元素也是唯一的。 -
性能:
由于红黑树的平衡性,TreeSet
的查找、插入和删除操作的平均时间复杂度和最坏时间复杂度都是 O(log n),其中 n 是树中元素的数量。这使得TreeSet
在处理大量数据时仍然能够保持高效的性能。
方法
-
添加元素:
boolean add(E e)
: 将指定的元素添加到此集合中(如果该元素尚未存在于集合中)。boolean addAll(Collection<? extends E> c)
: 将指定集合中的所有元素添加到此集合中(仅添加那些尚未存在于该集合中的元素)。
-
删除元素:
boolean remove(Object o)
: 从此集合中移除指定的元素(如果该元素存在于此集合中)。void clear()
: 移除此集合中的所有元素。
-
查找元素:
boolean contains(Object o)
: 如果此集合包含指定的元素,则返回true
。E first()
: 返回此集合中的第一个(最低)元素。E last()
: 返回此集合中的最后一个(最高)元素。E lower(E e)
: 返回此集合中小于指定元素的最大元素;如果不存在这样的元素,则返回null
。E floor(E e)
: 返回此集合中小于等于指定元素的最大元素;如果不存在这样的元素,则返回null
。E ceiling(E e)
: 返回此集合中大于等于指定元素的最小元素;如果不存在这样的元素,则返回null
。E higher(E e)
: 返回此集合中大于指定元素的最小元素;如果不存在这样的元素,则返回null
。NavigableSet<E> subSet(E fromElement, boolean fromInclusive, E toElement, boolean toInclusive)
: 返回此集合的部分视图,其元素的范围从fromElement
到toElement
。NavigableSet<E> headSet(E toElement, boolean inclusive)
: 返回此集合的部分视图,其元素小于(如果inclusive
为false
)或等于(如果inclusive
为true
)toElement
。NavigableSet<E> tailSet(E fromElement, boolean inclusive)
: 返回此集合的部分视图,其元素大于(如果inclusive
为false
)或等于(如果inclusive
为true
)fromElement
。
-
检查集合的状态:
boolean isEmpty()
: 如果此集合不包含任何元素,则返回true
。int size()
: 返回此集合中的元素数(其基数)。
-
迭代集合:
Iterator<E> iterator()
: 返回在此集合元素上进行迭代的迭代器,按元素的排序顺序进行迭代。Iterator<E> descendingIterator()
: 返回在此集合元素的降序视图上进行迭代的迭代器。Object[] toArray()
: 返回一个包含此集合中所有元素的数组。<T> T[] toArray(T[] a)
: 返回一个包含此集合中所有元素的数组;返回数组的运行时类型是指定数组的运行时类型T
。
-
其他方法:
Comparator<? super E> comparator()
: 返回对此集合中的元素进行排序的比较器;如果此集合使用其元素的自然顺序,则返回null
。E pollFirst()
: 检索并删除此集合的第一个(最低)元素;如果此集合为空,则返回null
。E pollLast()
: 检索并删除此集合的最后一个(最高)元素;如果此集合为空,则返回null
。