Java复习知识点十九：Set接口、HashSet底层机制、扩容和转化红黑树、LinkedHashSet

GQ学编程

已于 2022-06-07 11:58:30 修改

阅读量523

点赞数 1

分类专栏： Java基础知识详解文章标签： java 哈希算法开发语言

于 2022-06-06 22:04:44 首次发布

本文链接：https://blog.csdn.net/weixin_52797128/article/details/125154946

版权

Java基础知识详解专栏收录该内容

30 篇文章 2 订阅

订阅专栏

1、Set接口

基本介绍:

无序（添加和取出的顺序不一致）不包括LinkedHashSet，没有索引，
不允许重复元素，所以最多包含一个null
JDK API中Set接口的实现类有：

在这里插入图片描述

常用方法：和Collection接口一样

使用举例：以HashSet为例

注意：取出的顺序虽然不是添加的顺序，但是取出顺序是固定的

Set set = new HashSet();

        //1.set接口对象 不能存放重复的元素，可以添加一个null
        //2.set接口存放数据是无序的(即添加的顺序和取出的顺序不一致)
        //3.注意：取出的顺序虽然不是添加的顺序，但是取出顺序是固定的
        set.add("john");
        set.add("lucy");
        set.add("john");//重复
        set.add("jack");
        set.add("hsp");
        set.add("mary");
        set.add(null);
        set.add(null);
        System.out.println("set="+set);//[null, hsp, mary, john, lucy, jack]
        //遍历
        //方式1：使用迭代器
        System.out.println("===使用迭代器===");
        Iterator iterator = set.iterator();
        while (iterator.hasNext()) {
            Object obj = iterator.next();
            System.out.println("obj="+obj);
        }
        //方式2：使用增强for
        System.out.println("===使用增强for===");
        for (Object o : set) {
            System.out.println("obj="+o);
        }
        //set接口对象，不能使用索引来获取

2、HashSet

2.1 HashSet基本介绍

HashSet实现了Set接口
HashSet实际上是HashMap实现的，源码：
可以存放null值，但只允许有一个null
HashSet不保证元素是有序的，取决于hash后，在确定索引的结果
不能有重复元素

2.2 添加元素细节

HashSet不能添加相同的元素/数据？
经典例题：

HashSet hashSet = new HashSet();
        //HashSet不能添加相同的元素/数据？
        hashSet.add("lucy");//可以添加
        hashSet.add("lucy");//不能添加，因为是同一个字符串常量池对象
        hashSet.add(new Dog("tom"));//ok
        hashSet.add(new Dog("tom"));//no 重写了hashCode和equals方法
        System.out.println("hashset="+hashSet);//hashset=[Dog{name='tom'}, Dog{name='tom'}, lucy]

        //经典面试题 需看源码
        hashSet.add(new String("jack"));//ok
        hashSet.add(new String("jack"));//添加不了 String 重写了hashCode方法，相同内容的String对象返回一样的哈希值，也重写了equals
        System.out.println("hashset="+hashSet);

2.3 HashSet底层机制

因为HashSet实际上是HashMap实现的

HashMap底层是（数组+链表+红黑树）

在这里插入图片描述

模拟一个HashMap的底层结构：

public class HashSetStructure {
    public static void main(String[] args) {

        //模拟一个HashMap的底层结构

        //1.创建一个类型为Node的数组
        Node_[] table = new Node_[16];
        System.out.println("table="+table);

        Node_ john = new Node_("john", null);
        table[2] = john;

        Node_ jack = new Node_("jack", null);
        john.next = jack;//将jack连接到john的后面
        Node_ rose = new Node_("Rose", null);
        jack.next = rose;//将Rose连接到jack的后面

        Node_ lucy = new Node_("Lucy", null);
        table[3] = lucy;

        System.out.println("table="+table);
        
    }

}

class Node_ {
    Object item;//存放数据
    Node_ next;//指向下一个节点

    public Node_(Object item, Node_ next) {
        this.item = item;
        this.next = next;
    }

    @Override
    public String toString() {
        return "Node_{" +
                "item=" + item +
                ", next=" + next +
                '}';
    }
}

2.4 HashSet(HashMap)源码分析

添加元素的流程分析：

HashSet底层是HashMap
添加一个元素时，先得到hash值 -->会转成索引值
找到存储数据表table，看这个索引位置是否已经存放元素
如果没有，直接添入
如果有，调用equals比较，如果相同，就放弃添加，如果不相同，则添加到最后
在Java8中，如果一条链表的元素个数到达TREEIFY_THRESHOLD(默认是8)，并且table的大小 >= MIN_TREEIFY_CAPACITY（默认64），就会进行树化（红黑树）

源码解读：

HashSet hashSet = new HashSet();
hashSet.add("java");
hashSet.add("php");
hashSet.add("java");
System.out.println("set="+hashSet);

执行add（“java”）时：

进入无参构造

在这里插入图片描述

执行添加方法

PRESENT是一个对象类型的常量：
进入put方法：key 是要添加的元素，value是一个常量
进入hash方法：该方法得到key对应的hash值算法： (h = key.hashCode()) ^ (h >>> 16)
返回值后，进入putVal方法：
- 第一个if语句：当前table为null或者长度为0，就执行resize方法进行扩容
- 第二个if语句：根据 i=(n-1) & hash 来计算出当前元素应该存储的位置
  - 如果p ==null，表示该位置未存放元素，newNode，存放到i位置
- 最后返回null到put–>add方法

执行add（“php”）时：流程相似

执行add（“java”）时：

进入add --> put --> putVal
进入putVal后
- p的值会判断不为null（已经存放过“java”），进入else
- 进入第一个 if 判断：满足以下两个条件
  - ```
  p.hash == hash //表示要插入的当前元素e与要插入位置元素p的hash值是否相同
```
- ```
((k = p.key) == key || (key != null && key.equals(k))))
//若要插入的当前元素e与要插入位置元素p是否是同一个元素
//或者两个元素通过equals方法判断是否相同
```
- 若满足则 e=p 新元素替换老元素，并返回
- 不满足则进入else if，判断p是否是一个红黑树
  - 若是红黑树，则进入putTreeVal方法
- 也不是红黑树，进入下一个else
  - 循环比较该索引位置的链表
  - 相同则直接break；若都不相同，则直接加入到该链表最后
  - 加入之后，立即判断该链表是否已经到达8，若到达8，执行treeifyBin(tab, hash)方法：先判断
    - ```
    if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)(64)
        resize();
    //会先判断当前数组是否小于64，小于则先扩容数组
    //大于64则会将当前链表转为红黑树
```
- 加入之后结束

2.5 HashSet的扩容和树化

HashSet底层是HashMap，第一次添加时，table数组扩容到16，临界值(threshold)是（16 * 加载因子(loadFactor)是0.75 ）=12；
如果table数组的size（每添加一个元素size就会+1）使用到了临界值12**，就会按照2倍扩容到16 * 2=32，新的临界值等于32 * 0.75 = 24，依次类推；
在jdk8中，如果一条链表的元素个数到达TREEIFY_THRESHOLD(默认是8).并且table的大小>= MIN_TREEIFY CAPACITY(默认64),就会进行树化(红黑树)，否则仍然采用数组扩容机制

3、LinkedHashSet

基本介绍：

LInkedHashSet是HashSet的子类
LinkedHashSet底层是一个LinkedHashMap，底层维护了一个数组+双向链表
LinkedHashSet根据元素的hashCode值来决定元素的存储位置,同时使用链表维护元素的次序,这使得元素看起来是以插入顺序保存的。
不允许添加重复元素

在LinkedHastSet中维护了一个hash表和双向链表(LinkedHashSet有head和tail)
每一个节点有before和after属性,这样可以形成双向链表
在添加一个元素时，先求hash值，在求索引…确定该元素在table的位置,然后将添加的元素加入到双向链表(如果已经存在，不添加[原则和hashset一样])

tail.next = newElement H/示意代码

newElement.pre = tail

tail = newEelment;
这样的话,我们遍历LinkedHashSet 也能确保插入顺序和遍历顺序一致