【JAVA】HashSet 详解

弗瑞德学JAVA

于 2024-08-13 22:39:05 发布

阅读量469

点赞数 11

分类专栏： JAVA复习文章标签： java 哈希算法开发语言

本文链接：https://blog.csdn.net/weixin_37559642/article/details/141175715

版权

JAVA复习专栏收录该内容

22 篇文章 0 订阅

订阅专栏

HashSet

HashSet 是 Java 集合框架中的一个类，用于存储不重复的元素。它基于 HashMap 实现，并且不保证元素的顺序。下面是对 HashSet 的详细介绍：

1. 基本特点:

不重复性: HashSet 中的元素是唯一的，不能有重复的元素。当尝试将一个重复的元素添加到 HashSet 中时，旧的元素将被保留，新元素会被忽略。
无序性: HashSet 不保证元素的插入顺序。元素的顺序可能与插入顺序不同。
允许 null 值: HashSet 允许存储一个 null 值，但只能有一个 null 值。

2. 实现原理:

HashSet 是基于 HashMap 实现的。实际上，HashSet 使用了一个 HashMap 来存储它的元素。在 -HashSet 中，每个元素都是 HashMap 的键，而值则是一个固定对象（通常是 PRESENT）。
元素通过哈希码（hash code）进行存储。每次添加元素时，HashSet 使用元素的哈希码来确定存储位置。如果两个元素的哈希码相同（发生了哈希冲突），HashSet 使用链表或红黑树来处理冲突。

3. 常用方法:

add(E e): 向 HashSet 添加一个元素。如果元素已经存在，返回 false；否则返回 true。
remove(Object o): 从 HashSet 中移除指定的元素。如果元素存在，返回 true；否则返回 false。
contains(Object o): 检查 HashSet 中是否包含指定的元素。如果存在，返回 true；否则返回 false。
size(): 返回 HashSet 中的元素数量。
clear(): 清空 HashSet，移除所有元素。
isEmpty(): 检查 HashSet 是否为空。如果没有元素，返回 true；否则返回 false。

4. 性能:

HashSet 的大部分操作（如添加、删除、查找）时间复杂度为 O(1)，因为它们基于哈希表（HashMap）。
但是在最坏情况下（所有元素的哈希码都相同），时间复杂度可能会退化为 O(n)，因为此时 HashSet 需要遍历所有元素。

5. 使用示例:

import java.util.HashSet;

public class HashSetExample {
    public static void main(String[] args) {
        HashSet<String> set = new HashSet<>();

        // 添加元素
        set.add("Apple");
        set.add("Banana");
        set.add("Orange");

        // 尝试添加重复元素
        boolean isAdded = set.add("Apple"); // 返回 false

        // 检查是否包含某个元素
        boolean containsApple = set.contains("Apple"); // 返回 true

        // 移除元素
        set.remove("Banana");

        // 遍历 HashSet
        for (String fruit : set) {
            System.out.println(fruit);
        }
    }
}

6. 注意事项:

HashSet 是线程不安全的，如果多个线程同时访问一个 HashSet 并且至少有一个线程修改了它，那么必须手动同步。
由于 HashSet 依赖元素的哈希码，所以最好重写对象的 hashCode() 和 equals() 方法以确保正确的比较和存储。

总的来说，HashSet 是一种高效的数据结构，适用于需要快速查找和去重的场景。

面试题

1. HashSet 如何判断元素的唯一性？

HashSet 使用元素的 hashCode() 方法来计算哈希值，并使用 equals() 方法来判断两个元素是否相等。当一个元素被添加到 HashSet 中时，首先计算该元素的哈希值，然后在哈希表中查找是否存在相同哈希值的元素。如果存在相同哈希值的元素，进一步使用 equals() 方法来比较两个对象是否相等。如果 equals() 方法返回 true，则表示该元素已经存在，不能再添加，否则添加新元素。

2. HashSet 和 TreeSet 的区别是什么？

实现原理: HashSet 基于 HashMap 实现，使用哈希表存储元素。而 TreeSet 基于 TreeMap 实现，使用红黑树（自平衡二叉搜索树）存储元素。
排序: HashSet 不保证元素的顺序，元素的顺序可能随时变化。而 TreeSet 保持元素的自然顺序（或通过提供的比较器进行排序）。
性能: HashSet 的大部分操作（如插入、删除、查找）的时间复杂度为 O(1)，而 TreeSet 的时间复杂度为 O(log n)。
使用场景: 如果需要高效的元素存取且不关心顺序，可以选择 HashSet。如果需要有序的集合，可以选择 TreeSet。

3. 如何实现自定义对象的 HashSet？

要将自定义对象存储在 HashSet 中并确保它们的唯一性，必须重写该对象的 hashCode() 和 equals() 方法。
hashCode() 方法: 需要根据对象的关键属性生成一个唯一的哈希码。这个哈希码用于确定对象在哈希表中的存储位置。
equals() 方法: 需要根据对象的关键属性来判断两个对象是否相等。如果两个对象的 equals() 方法返回 true，则认为这两个对象相同，不能同时存在于 HashSet 中。
例如，如果你有一个包含 id 和 name 属性的 Person 对象，你可以根据 id 来生成哈希码，并在 equals() 方法中比较 id 和 name 是否相同。

public class Person {
    private int id;
    private String name;

    public Person(int id, String name) {
        this.id = id;
        this.name = name;
    }

    @Override
    public int hashCode() {
        return Objects.hash(id, name);
    }

    @Override
    public boolean equals(Object obj) {
        if (this == obj) return true;
        if (obj == null || getClass() != obj.getClass()) return false;
        Person person = (Person) obj;
        return id == person.id && Objects.equals(name, person.name);
    }
}