Set和Map接口

最新推荐文章于 2022-11-12 10:18:59 发布

Z.959

最新推荐文章于 2022-11-12 10:18:59 发布

阅读量111

点赞数

分类专栏： java 文章标签： servlet java html

本文链接：https://blog.csdn.net/qq_56751692/article/details/126274620

版权

java 专栏收录该内容

19 篇文章 1 订阅

订阅专栏

一、Set接口

Set集合代表一个无序集合，集合中的元素不可以重复，访问集合中的元素只能根据元素本身来访问。

无索引、不可以重复（元素唯一）、无序（存取顺序不一致）

实现Set接口的集合主要有：HashSet、LinkedHashSet、TreeSet。

HashSet类

HashSet是一种没有重复元素的无序集合，HashSet继承于AbstractSet，实现接口Set，内部使用HashMap来存储数据，数据存储在HashMap的key中，value只是同一个默认值，所以HashSet存储的值是不能重复的。

1、HashSet类的原理

（1）底层是哈希表（散列/hash）算法的封装。

（2）HashSet是线程不安全的。

2、HashSet类的常用方法

    public static void main(String[] args) {
        Set<String> set1 = new HashSet<>();
        set1.add("d");
        set1.add("b");
        set1.add("c");
        set1.add("c");
        set1.add("a");
        System.out.println(set1.size());// 4
        System.out.println(set1);// [a, b, c, d]
        set1.remove("b");
        System.out.println(set1);// [a, c, d]
        // 遍历删除
        Iterator<String> it = set1.iterator();
        while (it.hasNext()) {
            Object ele = it.next();
            if ("c".equals(ele)) {
                it.remove();
            }
        }
        System.out.println(set1); // [a, d]
    }

3、HashSet类中元素不重复原理

由源码分析中add()方法可知，HashSet集合中添加元素，实际是作为HashMap的Key存储，

    public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }

由于 HashMap 的 put() 方法添加 key-value 时，当新放入 HashMap 的 Entry 中 key 与集合中原有 Entry 的 key 相同（hashCode()返回值相等，通过 equals 比较也返回 true），新添加的 Entry 的 value 会将覆盖原来 Entry 的 value，但 key 不会有任何改变，因此如果向 HashSet 中添加一个已经存在的元素时，新添加的集合元素将不会被放入 HashMap中，原来的元素也不会有任何改变，这也就满足了 Set 中元素不重复的特性。

如果添加元素在 HashSet 中不存在的，则返回 true；如果添加的元素已经存在，返回 false。其原因在于 HashMap 的 put 方法。该方法在添加 key 不重复的键值对的时候，会返回 null。

4、HashSet中判断两个元素对象是否相同:

当添加新的对象到HashSet集合中时，二者缺一不可：

1）先判断该对象与集合对象中的hashCode值是否相同，如果不相同，则添加，否则，进行步骤2

2）再继续判断该对象与集合对象中的equals进行比较，如果返回false，则添加，否则，表示重复，不添加。

二、HashMap集合

1、HashMap结构
JDK7及其以前版本，HashMap：整体结构是一个"数组 + 链表" 结构

HashMap在JDK8之后，如果哈希表单向链表中节点（元素）超过8个，单向链表这种数据结构会变成红黑树数据结构；当红黑树上的节点（元素）数量少于6时，会重新把红黑树数据结构变成单向链表数据结构。
——这种方式是为了提高检索效率，二叉树的检索会再次缩小扫描范围，提高效率。

2、什么时候链表转换为红黑树：
当链表长度大于8，同时数组长度大于64时，将从链表转换为红黑树
当链表长度小于6时，如果该链表之前是红黑树，则重新还原为链表结构

HashMap集合的默认初始化容量是16，默认加载因子是0.75。
——默认加载因子是当HashMap集合底层数组的容量达到75%的时候，数组开始扩容。
注:HashMap集合初始化容量必须是2的倍数
HashMap集合的扩容：默认扩容到原容量的2倍。
HashMap集合的key和value允许为null。
HashMap集合的底层是哈希表/散列表的数据结构。
哈希表是一个怎样的数据结构？
哈希表/散列表：底层实际上是一个一维数组，这个数组中每一个元素是一个单向链表。——数组和单向链表的结合体

数组：在查询方面效率较高，随机增删方面效率很低。
单向链表：在随机增删方面效率较高，查询方面效率很低。

——哈希表将以上两种数据结构融合在一起，充分发挥它们各自的优点。

HashMap集合的key部分（HashSet集合）的特点：无序不可重复。

无序的原理：
—— 底层会调用 key 的 hashCode() 方法得出 hash值，然后通过哈希函数/哈希算法将hash值转换成数组的下标，如果该下标上没有任何元素，就把Node添加到这个位置上；如果此下标上有链表，则会拿key跟链表上每一个节点中的key进行equals，再进行添加或覆盖。

不可重复的原理：
—— 在添加时，key和链表上每一个节点的key会进行equals，如果key相同会覆盖，key不相同会在链表尾部进行添加。

三、Hashtable集合

Hashtable集合默认初始容量为11，默认加载因子为0.75
——默认加载因子是当Hashtable集合底层数组的容量达到75%的时候，数组开始扩容。
Hashtable集合的扩容：默认扩容到原容量的2倍再加1（（原容量*2）+1）。
Hashtable集合的key和value不能为null。（为null会出现空指针异常）
——HashMap集合的key和value可以为null。
Hashtable集合的底层是哈希表/散列表的数据结构。

四、TreeMap集合

TreeMap集合底层是一个二叉树数据结构。

放到TreeMap集合中key部分的元素相当于放到TreeSet集合中。

TreeMap集合中存储元素的特点：与TreeSet相同，无序不可重复，元素可按照大小顺序自动排序，称为可排序集合。

放到TreeSet或者TreeMap集合key部分的元素要想做到自动排序,包括两种方式：
—— 第一种：放在集合中的元素实现java.lang.Comparable接口。

public class Person implements Comparable<Person> {

	private int id;
	private String name;
	private String nickname;
	private String gender;
	private int age;

	@Override
	public int compareTo(Person o) {
		// 指定规则：id的升序排列
//		return this.getId() - o.getId();
	}

}

—— 第二种：在构造TreeSet或者TreeMap集合的时候给它传一个Comparator比较器对象。

		Collections.sort(users, new Comparator<Person>() {
			// 临时指定对象的排序规则是：年龄由大到小
			@Override
			public int compare(Person o1, Person o2) {
				return o2.getAge() - o1.getAge();
			}
		});

————当比较规则不会发生改变的时候，或者说当比较规则只有1个的时候，建议实现Comparable接口。
————如果比较规则有多个，并且需要多个比较规则之间频繁切换，建议使用Comparator接口。（Comparator接口的设计符合OCP原则。）