基础复习第二十天 Set集合及常用实现类的源码分析-CSDN博客

本文链接：https://blog.csdn.net/m0_61477124/article/details/129146314

Set接口是Collection的子接口，不允许包含重复元素。HashSet是主要实现类，基于HashMap，适用于快速查找。LinkedHashSet保持插入顺序，适合频繁遍历。TreeSet可排序，依据Comparable或Comparator。添加元素时，通过hashCode和equals方法判断重复。

摘要由CSDN通过智能技术生成

Set集合

Set接口是Collection的子接口，set接口没有提供额外的方法。但是比Collection接口更加严格了。

Set 集合不允许包含相同的元素，如果试把两个相同的元素加入同一个 Set 集合中，则添加操作失败。

Set集合支持的遍历方式和Collection集合一样：foreach和Iterator。

Set的常用实现类有：HashSet、TreeSet、LinkedHashSet。

HashSet

Set接口的框架:
|---Collection接口:单列集合，用来存储一个一个的对象。
|---Set接口:存储无序的、不可重复的数据。
|---HashSet:作为Set接口的主要实现类：线程不安全的；可以存储null值
|---LinkedHashSet:作为HashSet的子类；遍历其内部数据时，可以按照添加的顺序遍历
对于频繁的遍历操作，LinkedHashSet效率高于HashSet。
|---TreeSet:可以按照添加对象的指定属性，进行排序。
1.Set接口中没有额外定义新的方法，使用的都是Collection中声明过的方法。

一、Set:存储无序的，不可重复的数据
1.无序性:不等于随机性。存储的数据底层数组中并非按照数组索引的顺序添加，而是根据数据的哈希值进行存储的。
2.不可重复性:不能添加相同的元素。保证添加的元素按照了equals()判断时，不能返回true。即相同的元素只能添加一个。
二、添加元素的过程:以HashSet为例:
我们向HashSet中添加元素a，首先调用元素a所在类的hashCode()方法，计算元素a的哈希值，此哈希值接着
通过某种算法计算出在HashSet底层数组中存放的位置(即为索引位置)，判断数组此位置上是否已经有元素:
1.如果此位置上没有其它元素，此元素添加成功。--->情况1
2.如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值:
2.1如果hash值不相同，则元素a添加成功。--->情况2
2.2如果hash值相等，进而需要调用元素a所在类的equals()方法:
2.2.1 equals()返回true，则元素a添加失败。
2.2.2 equals()返回false，则元素a添加成功。--->情况3
3.对于添加成功的情况2和情况3而言:元素a与已经存在指定索引位置上数据以链表的方式存储时。
jdk 7 :元素a放到数组中，指向原来的元素。
jdk 8 :原来的元素放到数组中，指向元素a。
总结:七上八下
HashSet底层:数组+链表的结构。(前提:jdk7)

 /**
     * Set接口的框架:
     * |---Collection接口:单列集合，用来存储一个一个的对象。
     *        |---Set接口:存储无序的、不可重复的数据。
     *               |---HashSet:作为Set接口的主要实现类：线程不安全的；可以存储null值
     *                   |---LinkedHashSet:作为HashSet的子类；遍历其内部数据时，可以按照添加的顺序遍历
     *               |---TreeSet:可以按照添加对象的指定属性，进行排序。
     * 1.Set接口中没有额外定义新的方法，使用的都是Collection中声明过的方法。
     *
     */


    /**
     * 一、Set:存储无序的，不可重复的数据
     * 1.无序性:不等于随机性。存储的数据底层数组中并非按照数组索引的顺序添加，而是根据数据的哈希值进行存储的。
     *
     * 2.不可重复性:不能添加相同的元素。保证添加的元素按照了equals()判断时，不能返回true。即相同的元素只能添加一个。
     *
     * 二、添加元素的过程:以HashSet为例:
     * 我们向HashSet中添加元素a，首先调用元素a所在类的hashCode()方法，计算元素a的哈希值，此哈希值接着
     * 通过某种算法计算出在HashSet底层数组中存放的位置(即为索引位置)，判断数组此位置上是否已经有元素:
     *
     *      1.如果此位置上没有其它元素，此元素添加成功。--->情况1
     *      2.如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值:
     *           2.1如果hash值不相同，则元素a添加成功。--->情况2
     *           2.2如果hash值相等，进而需要调用元素a所在类的equals()方法:
     *                  2.2.1 equals()返回true，则元素a添加失败。
     *                  2.2.2 equals()返回false，则元素a添加成功。--->情况3
     *      3.对于添加成功的情况2和情况3而言:元素a与已经存在指定索引位置上数据以链表的方式存储时。
     *      jdk 7 :元素a放到数组中，指向原来的元素。
     *      jdk 8 :原来的元素放到数组中，指向元素a。
     *      总结:七上八下
     *
     */

    @Test
    public void tests1(){
        HashSet set = new HashSet();
        set.add(123);
        set.add(456);
        set.add(12344);
        set.add(789);
        set.add(123);
        set.add(null);
        System.out.println(set.size());//5
        System.out.println(set);//[null, 789, 456, 12344, 123],打印出的顺序跟添加时的顺序不一致，
                                // 添加了两个123，但是只打印出了一个123，体现了不可重复性。

        //遍历
        Iterator iterator = set.iterator();
        while (iterator.hasNext()) {
            System.out.print(iterator.next()+";");//null;789;456;12344;123;打印出的顺序跟添加时的顺序不一致，即无序性
        }
    }

HashSet 是 Set 接口的典型实现，大多数时候使用 Set 集合时都使用这个实现类。

java.util.HashSet底层的实现其实是一个java.util.HashMap支持，然后HashMap的底层物理实现是一个Hash表。

HashSet 按 Hash 算法来存储集合中的元素，因此具有很好的存取和查找性能。HashSet 集合判断两个元素相等的标准：两个对象通过 hashCode() 方法比较相等，并且两个对象的 equals() 方法返回值也相等。因此，存储到HashSet的元素要重写hashCode和equals方法。

LinkedHashSet

LinkedHashSet继承于HashSet，在添加数据的同时，每个数据还维护了两个引用，记录此数据前一个数据和后一个数据。

优点:对于频繁的遍历操作，LinkedHashSet效率高于HashSet。

LinkedHashSet是HashSet的子类，它在HashSet的基础上，在结点中增加两个属性before和after维护了结点的前后添加顺序。java.util.LinkedHashSet，它是链表和哈希表组合的一个数据存储结构。LinkedHashSet插入性能略低于 HashSet，但在迭代访问 Set 里的全部元素时有很好的性能。

LinkedHashSet<String> set = new LinkedHashSet<>();
set.add("张三");
set.add("李四");
set.add("王五");
set.add("张三");
        
System.out.println("元素个数：" + set.size());
for (String name : set) {
    System.out.println(name);
}

运行结果：
元素个数：3
张三
李四
王五

TreeSet

1.向TreeSet中添加的数据，要求是相同的类的对象。
2.两种排序方式:自然排序(实现Comparable接口)和定制排序(实现Coparator接口)。
3.自然排序中，比较两个对象是否相同的标准为:compareTo()返回0.不在是equals()。
4.定制排序中，比较两个对象是否相同的标准为:compare()返回0.不在是equals()。

底层结构：里面维护了一个TreeMap，都是基于红黑树实现的！

特点：

不允许重复。

实现排序:自然排序或定制排序。

如何实现去重的？

如果使用的是自然排序，则通过调用实现的compareTo方法
如果使用的是定制排序，则通过调用比较器的compare方法

如何排序？

方式一：自然排序
让待添加的元素类型实现Comparable接口，并重写compareTo方法
方式二：定制排序
创建Set对象时，指定Comparator比较器接口，并实现compare方法

自然排序

如果试图把一个对象添加到 TreeSet 时，则该对象的类必须实现 Comparable 接口。实现 Comparable 的类必须实现 compareTo(Object obj) 方法，两个对象即通过 compareTo(Object obj) 方法的返回值来比较大小。对于 TreeSet 集合而言，它判断两个对象是否相等的唯一标准是：两个对象通过 compareTo(Object obj) 方法比较返回值为0。