集合HashSet、TreeSet、LinkedHashSet

最新推荐文章于 2024-06-20 10:45:24 发布

暗夜无声

最新推荐文章于 2024-06-20 10:45:24 发布

阅读量379

点赞数

分类专栏： java 文章标签： java

本文链接：https://blog.csdn.net/lwx675652056/article/details/99704186

版权

java 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

一.HashSet

特点：

1.HashSet中不能有相同的元素，可以有一个Null元素（只能有一个），存入的元素是无序的。

2.HashSet如何保证唯一性？

1).HashSet底层数据结构是哈希表，哈希表就是存储唯一系列的表，而哈希值是由对象的hashCode()方法生成。

2).确保唯一性的两个方法：hashCode()和equals()方法。

3.添加、删除操作时间复杂度都是O(1)。

4.非线程安全

当向HashSet集合中存入一个元素时，HashSet会调用该对象的hashCode()方法来得到该对象的hashCode值，然后根据 hashCode值来决定该对象在HashSet中存储位置。
简单的说，HashSet集合判断两个元素相等的标准是两个对象通过equals方法比较相等，并且两个对象的hashCode()方法返回值相等
注意，如果要把一个对象放入HashSet中，重写该对象对应类的equals方法，也应该重写其hashCode()方法。其规则是如果两个对象通过equals方法比较返回true时，其hashCode也应该相同。另外，对象中用作equals比较标准的属性，都应该用来计算 hashCode的值。

HashSet的底层实现:
HashSet实现Set接口，由哈希表（实际上是一个HashMap实例）支持。它不保证set 的迭代顺序；特别是它不保证该顺序恒久不变。此类允许使用null元素。HashSet中不允许有重复元素，这是因为HashSet是基于HashMap实现的，HashSet中的元素都存放在HashMap的key上面，而value中的值都是统一的一个private static final Object PRESENT = new Object();。HashSet跟HashMap一样，都是一个存放链表的数组。
　　HashSet中add方法调用的是底层HashMap中的put()方法，而如果是在HashMap中调用put，首先会判断key是否存在，如果key存在则修改value值，如果key不存在这插入这个key-value。而在set中，因为value值没有用，也就不存在修改value值的说法，因此往HashSet中添加元素，首先判断元素（也就是key）是否存在，如果不存在这插入，如果存在着不插入，这样HashSet中就不存在重复值。

二.LinkedHashSet

特点：

1.LinkedHashSet中不能有相同元素，可以有一个Null元素，元素严格按照放入的顺序排列。

2.LinkedHashSet如何保证有序和唯一性？

1).底层数据结构由哈希表和链表组成。

2).链表保证了元素的有序即存储和取出一致，哈希表保证了元素的唯一性。

3.添加、删除操作时间复杂度都是O(1)。

4.非线程安全

LinkedHashSet集合同样是根据元素的hashCode值来决定元素的存储位置，但是它同时使用链表维护元素的次序。这样使得元素看起来像是以插入顺序保存的，也就是说，当遍历该集合时候，LinkedHashSet将会以元素的添加顺序访问集合的元素。
LinkedHashSet在迭代访问Set中的全部元素时，性能比HashSet好，但是插入时性能稍微逊色于HashSet。

LinkedHashSet的底层实现：
LinkedHashSet继承了HashSet，又基于LinkedHashMap来实现。LinkedHashSet底层使用LinkedHashMap的key来保存所有元素，从而维护着一个运行于所有元素的双向链表。该双向链表定义了迭代顺序，该顺序分为插入顺序和访问顺序（具体请看：LinkedHashMap内部实现）。因为它继承了父类HashSet，所以它的所有操作方法都与HashSet相同，直接调用父类的方法即可。其中，HashSet还专为LinkedHashSet提供了构造方法，由于包访问权限，并未对外公开。代码如下：

/**  
 * 以指定的initialCapacity和loadFactor构造一个新的空链接哈希集合。   
 *  
 * 实际底层会以指定的参数构造一个空LinkedHashMap实例来实现。  
 * @param initialCapacity 初始容量。  
 * @param loadFactor 加载因子。  
 * @param dummy 标记。  
 */    
HashSet(int initialCapacity, float loadFactor, boolean dummy) {    
	map = new LinkedHashMap<E,Object(initialCapacity, loadFactor);  
}

三.TreeSet

特点：

1.TreeSet是中不能有相同元素，不可以有Null元素，根据元素的自然顺序进行排序。

2.TreeSet如何保证元素的排序和唯一性？

底层的数据结构是红黑树(一种自平衡二叉查找树)

3.添加、删除操作时间复杂度都是O(log(n))，并且提供了first(), last(), headSet(), tailSet()等方法来处理有序集合。

4.非线程安全

TreeSet是SortedSet接口的唯一实现类，TreeSet可以确保集合元素处于排序状态。TreeSet支持两种排序方式，自然排序和定制排序，其中自然排序为默认的排序方式。向TreeSet中加入的应该是同一个类的对象。
TreeSet判断两个对象不相等的方式是两个对象通过equals方法返回false，或者通过CompareTo方法比较没有返回0
自然排序
自然排序使用要排序元素的CompareTo（Object obj）方法来比较元素之间大小关系，然后将元素按照升序排列。
Java提供了一个Comparable接口，该接口里定义了一个compareTo(Object obj)方法，该方法返回一个整数值，实现了该接口的对象就可以比较大小。
obj1.compareTo(obj2)方法如果返回0，则说明被比较的两个对象相等，如果返回一个正数，则表明obj1大于obj2，如果是负数，则表明obj1小于obj2。
如果我们将两个对象的equals方法总是返回true，则这两个对象的compareTo方法返回应该返回0
定制排序
自然排序是根据集合元素的大小，以升序排列，如果要定制排序，应该使用Comparator接口，实现 int compare(T o1,T o2)方法。

TreeSet的底层实现:
TreeMap 的实现就是红黑树数据结构，也就说是一棵自平衡的排序二叉树，这样就可以保证当需要快速检索指定节点。

下面先看 TreeSet 类的部分源代码：

 public class TreeSet<E> extends AbstractSet<E> 
    implements NavigableSet<E>, Cloneable, java.io.Serializable 
 { 
    // 使用 NavigableMap 的 key 来保存 Set 集合的元素
    private transient NavigableMap<E,Object> m; 
    // 使用一个 PRESENT 作为 Map 集合的所有 value。
    private static final Object PRESENT = new Object(); 
    // 包访问权限的构造器，以指定的 NavigableMap 对象创建 Set 集合
    TreeSet(NavigableMap<E,Object> m) 
    { 
        this.m = m; 
    } 
    public TreeSet()                                      // ①
    { 
        // 以自然排序方式创建一个新的 TreeMap，
        // 根据该 TreeSet 创建一个 TreeSet，
        // 使用该 TreeMap 的 key 来保存 Set 集合的元素
        this(new TreeMap<E,Object>()); 
    } 
    public TreeSet(Comparator<? super E> comparator)     // ②
    { 
        // 以定制排序方式创建一个新的 TreeMap，
        // 根据该 TreeSet 创建一个 TreeSet，
        // 使用该 TreeMap 的 key 来保存 Set 集合的元素
        this(new TreeMap<E,Object>(comparator)); 
    } 
    public TreeSet(Collection<? extends E> c) 
    { 
        // 调用①号构造器创建一个 TreeSet，底层以 TreeMap 保存集合元素
        this(); 
        // 向 TreeSet 中添加 Collection 集合 c 里的所有元素
        addAll(c); 
    } 
    public TreeSet(SortedSet<E> s) 
    { 
        // 调用②号构造器创建一个 TreeSet，底层以 TreeMap 保存集合元素
        this(s.comparator()); 
        // 向 TreeSet 中添加 SortedSet 集合 s 里的所有元素
        addAll(s); 
    } 
    //TreeSet 的其他方法都只是直接调用 TreeMap 的方法来提供实现
    ... 
    public boolean addAll(Collection<? extends E> c) 
    { 
        if (m.size() == 0 && c.size() > 0 && 
            c instanceof SortedSet && 
            m instanceof TreeMap) 
        { 
            // 把 c 集合强制转换为 SortedSet 集合
            SortedSet<? extends E> set = (SortedSet<? extends E>) c; 
            // 把 m 集合强制转换为 TreeMap 集合
            TreeMap<E,Object> map = (TreeMap<E, Object>) m; 
            Comparator<? super E> cc = (Comparator<? super E>) set.comparator(); 
            Comparator<? super E> mc = map.comparator(); 
            // 如果 cc 和 mc 两个 Comparator 相等
            if (cc == mc || (cc != null && cc.equals(mc))) 
            { 
                // 把 Collection 中所有元素添加成 TreeMap 集合的 key 
                map.addAllForTreeSet(set, PRESENT); 
                return true; 
            } 
        } 
        // 直接调用父类的 addAll() 方法来实现
        return super.addAll(c); 
    } 
    ... 
 }

从上面代码可以看出，TreeSet 的 ① 号、② 号构造器的都是新建一个 TreeMap 作为实际存储 Set 元素的容器，而另外 2 个构造器则分别依赖于 ① 号和 ② 号构造器，由此可见，TreeSet 底层实际使用的存储容器就是 TreeMap。
与 HashSet 完全类似的是，TreeSet 里绝大部分方法都是直接调用 TreeMap 的方法来实现的，这一点读者可以自行参阅 TreeSet 的源代码，此处就不再给出了。
对于 TreeMap 而言，它采用一种被称为“红黑树”的排序二叉树来保存 Map 中每个 Entry —— 每个 Entry 都被当成“红黑树”的一个节点对待。例如对于如下程序而言：

public class TreeMapTest 
 { 
    public static void main(String[] args) 
    { 
        TreeMap<String , Double> map = 
            new TreeMap<String , Double>(); 
        map.put("ccc" , 89.0); 
        map.put("aaa" , 80.0); 
        map.put("zzz" , 80.0); 
        map.put("bbb" , 89.0); 
        System.out.println(map); 
    } 
 }

当程序执行 map.put(“ccc” , 89.0); 时，系统将直接把 “ccc”-89.0 这个 Entry 放入 Map 中，这个 Entry 就是该“红黑树”的根节点。接着程序执行 map.put(“aaa” , 80.0); 时，程序会将 “aaa”-80.0 作为新节点添加到已有的红黑树中。
以后每向 TreeMap 中放入一个 key-value 对，系统都需要将该 Entry 当成一个新节点，添加成已有红黑树中，通过这种方式就可保证 TreeMap 中所有 key 总是由小到大地排列。例如我们输出上面程序，将看到如下结果（所有 key 由小到大地排列）：
{aaa=80.0, bbb=89.0, ccc=89.0, zzz=80.0}

总结：

通过以上特点可以分析出，三者都保证了元素的唯一性，如果无排序要求可以选用HashSet；如果想取出元素的顺序和放入元素的顺序相同，那么可以选用LinkedHashSet。如果想插入、删除立即排序或者按照一定规则排序可以选用TreeSet。如果考虑性能和速度方面，HashSet 是最快的，LinkedHashSet 在性能方面排第二，或者近乎接近于HashSet，TreeSet稍微慢一些，因为每一次插入元素都需要执行排序操作。

四、面试常问：

HashSet、LinkedHashSet、TreeSet的区别

HashSet、LinkedHashSet、TreeSet是实现Set接口的3个实现类，其中：
HashSet只是通用的存储数据的集合，
LinkedHashSet的主要功能用于保证FIFO(先进先出)即有序的集合，
TreeSet的主要功能用于排序(自然排序或者比较器排序)

1 相同点
1)HashSet、LinkedHashSet、TreeSet都实现了Set接口
2)三者都保证了元素的唯一性，即不允许元素重复
3)三者都不是线程安全的
可以使用Collections.synchronizedSet()方法来保证线程安全
2 不同点
2.1 排序
HashSet不保证元素的顺序
LinkHashSet保证FIFO即按插入顺序排序
TreeSet保证元素的顺序，支持自定义排序规则
2.2 null值
HashSet，LinkedHashSet允许添加null值，TreeSet不允许添加null值，添加null时会抛出java.lang.NullPointerException异常。
2.3 性能
理论情况下，添加相同数量的元素， HashSet最快，其次是LinkedHashSet，TreeSet最慢（因为内部要排序）。

TreeSet的两种排序方式

1 自然排序
自然排序的实现方式是让Student类实现接口Comparable，并重写该接口的方法compareTo，该方法会定义排序规则。
使用IDEA的快捷键生成的compareTo方法默认是这样的：
@Override
public int compareTo(Student o) {
return 0;
}
这个方法会在执行add()方法添加元素时执行，以便确定元素的位置。
如果返回0，代表两个元素相同，只会保留第一个元素
如果返回值大于0，代表这个元素要排在参数中指定元素o的后面
如果返回值小于0，代表这个元素要排在参数中指定元素o的前面

2 比较器排序
比较器排序的实现方式是新建一个比较器类，继承接口Comparator，重写接口中的Compare()方法。
注意：使用此种方式Student类不需要实现接口Comparable，更不需要重写该接口的方法compareTo。

public class StudentComparator implements Comparator<Student> { 
	@Override 
	public int compare(Student o1, Student o2) { 
			// 排序规则描述如下 
			// 按照姓名的长度排序,长度短的排在前面,长度长的排在后面 
			// 如果姓名的长度相同，按字典顺序比较String 
			// 如果姓名完全相同,按年龄排序,年龄小的排在前面,年龄大的排在后面 
			int orderByNameLength = o1.getName().length() - o2.getName().length(); 
			int orderByName = orderByNameLength == 0 ? o1.getName().compareTo(o2.getName()) : orderByNameLength; 
			int orderByAge = orderByName == 0 ? o1.getAge() - o2.getAge() : orderByName; 
			return orderByAge;
	} 
}

暗夜无声

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
集合HashSet、TreeSet、LinkedHashSet

一.HashSet特点：1.HashSet中不能有相同的元素，可以有一个Null元素（只能有一个），存入的元素是无序的。2.HashSet如何保证唯一性？1).HashSet底层数据结构是哈希表，哈希表就是存储唯一系列的表，而哈希值是由对象的hashCode()方法生成。2).确保唯一性的两个方法：hashCode()和equals()方法。3.添加、删除操作时间复杂度都是O(1)。...
复制链接

扫一扫