006 HashSet是如何去重的

简洁冬冬

于 2024-06-05 22:08:28 发布

阅读量760

点赞数 23

分类专栏：基础文章标签：哈希算法散列表数据结构

本文链接：https://blog.csdn.net/m0_46695127/article/details/139480793

版权

基础专栏收录该内容

7 篇文章 0 订阅

订阅专栏

文章目录

- HashSet是如何去重的

HashSet是如何去重的

数据结构

HashSet底层依赖于HashMap的数据结构，即一个哈希表。这个哈希表本质上是一个数组，数组的每个元素称为一个桶。每个桶中存储的不是单一元素，而是一个链表或红黑树(在Java8及以后的版本中，当链表长度超过一定阈值，如8时，会转化为红黑树以提高效率)

哈希函数与索引计算

当向HashSet中添加元素时，首先会调用元素的hashCode()方法计算哈希码。然后，通过某种散列函数(哈希函数)将这个哈希码转换为数组(即哈希表)的索引位置。这个索引位置就是元素应该存储的桶的位置。

存储与去重

存储过程：如果计算出的索引位置的桶为空，则直接将元素存入该桶中。如果桶中已经有其他元素(即发生哈希冲突)，则需要遍历链表或红黑树来查找是否已经存在相同的元素。如果不存在相同的元素，则将新元素添加到链表或红黑树中；如果存在相同的元素，则不进行任何操作，从而保证了HashSet中元素的唯一性。

去重实现：HashSet的去重功能正是基于上述存储过程实现的。在添加新元素前，它会检查哈希表中是否已经存在该元素。如果存在，则不添加；如果不存在，则添加到哈希表中。这样，HashSet中就不会出现重复的元素。

查找与删除

查找：当从HashSet中查找一个元素时，也是首先使用哈希函数计算出元素的哈希值，并根据哈希值找到对应的桶。然后遍历链表或红黑树来查找是否存在相同的元素。

删除：删除操作与查找类似，首先定位到元素所在的桶，然后在链表或红黑树中查找并删除该元素

特征与总结

无序性：HashSet中的元素是无序的，因为哈希表不保证元素的顺序

唯一性：通过哈希函数和哈希表的结合使用，HashSet能够高效地实现元素的去重功能

性能：由于使用了哈希表和哈希函数，HashSet在插入、删除和查找操作上都具有较高的效率（平均时间复杂度接近O(1)）。

总的来说,HashSet通过哈希表和哈希函数的运算，按照一定的算法将元素存储在桶中，可以实现快速的插入、删除和查找操作，并具有较高的效率。同时，由于其内部的去重机制，HashSet中的元素是无序且不重复的

键

在哈希表（Hash Table）的上下文中，“键”（Key）是指用于在哈希表中唯一标识一个条目的数据。在HashSet中，键通常是要存储的元素本身。每个元素都会通过哈希函数转换为一个哈希值，这个哈希值进一步被用来确定元素在哈希表中的存储位置（即桶的位置）。

简单来说，当你向HashSet中添加一个元素时，这个元素就是“键”。HashSet使用这个“键”来计算哈希值，并据此决定将元素存储在哪个桶中。在HashMap中，情况稍有不同，因为HashMap存储键值对（Key-Value Pair），其中“键”用于计算存储位置，并唯一标识一个特定的值（Value）。

在HashSet的情况下，由于只存储单一的元素而没有对应的“值”，所以元素本身就作为“键”来处理。这样，每个元素都会根据其自身的哈希值被放置在哈希表的适当位置，从而实现快速查找、插入和删除操作，并保证元素的唯一性。

HashSet之所以能够实现快速的插入、删除和查找操作，并具有去重机制，主要得益于其背后的数据结构和算法设计。以下是详细解释：

哈希表和哈希函数：
- 哈希表（Hash Table）是一种根据键（Key）直接访问在内存存储位置的数据结构。
- 哈希函数（Hash Function）是将键映射到一个位置（通常是一个数组索引）的算法。理想情况下，哈希函数会将不同的键映射到不同的位置，以最小化冲突。
高效的插入、删除和查找：
- 当向HashSet中插入一个元素时，哈希函数会计算该元素的哈希值，然后将其放在哈希表对应的桶（Bucket）中。由于哈希函数的计算通常很快，且直接定位到存储位置，所以插入操作平均时间复杂度接近O(1)。
- 查找和删除操作也类似，先通过哈希函数快速定位到元素可能所在的位置，然后进行查找或删除，因此这些操作的时间复杂度也接近O(1)。
去重机制：
- 当插入一个新元素时，HashSet会首先计算该元素的哈希值，并检查对应桶中是否已经有相同哈希值的元素。
- 如果有哈希冲突（即不同元素具有相同的哈希值），HashSet会使用链表或开放寻址法等方式解决冲突。在解决冲突的过程中，会检查冲突元素是否确实与新元素相同，以确保集合中元素的唯一性。
- 这种机制保证了HashSet中的元素不会重复。
元素无序：
- HashSet不保证元素的顺序，因为元素是根据其哈希值存储在哈希表中的不同桶中的。
- 哈希表的设计目标是快速查找和插入，而不是保持元素的顺序。
- 如果需要保持插入顺序，可以考虑使用LinkedHashSet，它在HashSet的基础上维护了一个双向链表来记录插入顺序。