一、Set接口
Set集合代表一个无序集合,集合中的元素不可以重复,访问集合中的元素只能根据元素本身来访问。
无索引、不可以重复(元素唯一)、无序(存取顺序不一致)
实现Set接口的集合主要有:HashSet、LinkedHashSet、TreeSet。
HashSet类
HashSet是一种没有重复元素的无序集合,HashSet继承于AbstractSet,实现接口Set,内部使用HashMap来存储数据,数据存储在HashMap的key中,value只是同一个默认值,所以HashSet存储的值是不能重复的。
1、HashSet类的原理
(1)底层是哈希表(散列/hash)算法的封装。
(2)HashSet是线程不安全的。
2、HashSet类的常用方法
public static void main(String[] args) {
Set<String> set1 = new HashSet<>();
set1.add("d");
set1.add("b");
set1.add("c");
set1.add("c");
set1.add("a");
System.out.println(set1.size());// 4
System.out.println(set1);// [a, b, c, d]
set1.remove("b");
System.out.println(set1);// [a, c, d]
// 遍历删除
Iterator<String> it = set1.iterator();
while (it.hasNext()) {
Object ele = it.next();
if ("c".equals(ele)) {
it.remove();
}
}
System.out.println(set1); // [a, d]
}
3、HashSet类中元素不重复原理
由源码分析中add()方法可知,HashSet集合中添加元素,实际是作为HashMap的Key存储,
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
由于 HashMap 的 put() 方法添加 key-value 时,当新放入 HashMap 的 Entry 中 key 与集合中原有 Entry 的 key 相同(hashCode()返回值相等,通过 equals 比较也返回 true),新添加的 Entry 的 value 会将覆盖原来 Entry 的 value,但 key 不会有任何改变,因此如果向 HashSet 中添加一个已经存在的元素时,新添加的集合元素将不会被放入 HashMap中,原来的元素也不会有任何改变,这也就满足了 Set 中元素不重复的特性。
如果添加元素在 HashSet 中不存在的,则返回 true;如果添加的元素已经存在,返回 false。其原因在于 HashMap 的 put 方法。该方法在添加 key 不重复的键值对的时候,会返回 null。
4、HashSet中判断两个元素对象是否相同:
当添加新的对象到HashSet集合中时,二者缺一不可:
1)先判断该对象与集合对象中的hashCode值是否相同,如果不相同,则添加,否则,进行步骤2
2)再继续判断该对象与集合对象中的equals进行比较,如果返回false,则添加,否则,表示重复,不添加。
二、HashMap集合
1、HashMap结构
JDK7及其以前版本,HashMap:整体结构是一个"数组 + 链表" 结构
HashMap在JDK8之后,如果哈希表单向链表中节点(元素)超过8个,单向链表这种数据结构会变成红黑树数据结构;当红黑树上的节点(元素)数量少于6时,会重新把红黑树数据结构变成单向链表数据结构。
——这种方式是为了提高检索效率,二叉树的检索会再次缩小扫描范围,提高效率。
2、什么时候链表转换为红黑树:
当链表长度大于8,同时数组长度大于64时,将从链表转换为红黑树
当链表长度小于6时,如果该链表之前是红黑树,则重新还原为链表结构
- HashMap集合的默认初始化容量是16,默认加载因子是0.75。
- ——默认加载因子是当HashMap集合底层数组的容量达到75%的时候,数组开始扩容。
- 注:HashMap集合初始化容量必须是2的倍数
- HashMap集合的扩容:默认扩容到原容量的2倍。
- HashMap集合的key和value允许为null。
- HashMap集合的底层是哈希表/散列表的数据结构。
- 哈希表是一个怎样的数据结构?
- 哈希表/散列表:底层实际上是一个一维数组,这个数组中每一个元素是一个单向链表。——数组和单向链表的结合体
- 数组:在查询方面效率较高,随机增删方面效率很低。
- 单向链表:在随机增删方面效率较高,查询方面效率很低。
- ——哈希表将以上两种数据结构融合在一起,充分发挥它们各自的优点。
HashMap集合的key部分(HashSet集合)的特点:无序不可重复。
无序的原理:
—— 底层会调用 key 的 hashCode() 方法得出 hash值,然后通过哈希函数/哈希算法将hash值转换成数组的下标,如果该下标上没有任何元素,就把Node添加到这个位置上;如果此下标上有链表,则会拿key跟链表上每一个节点中的key进行equals,再进行添加或覆盖。
不可重复的原理:
—— 在添加时,key和链表上每一个节点的key会进行equals,如果key相同会覆盖,key不相同会在链表尾部进行添加。
三、Hashtable集合
Hashtable集合默认初始容量为11,默认加载因子为0.75
——默认加载因子是当Hashtable集合底层数组的容量达到75%的时候,数组开始扩容。
Hashtable集合的扩容:默认扩容到原容量的2倍再加1((原容量*2)+1)。
Hashtable集合的key和value不能为null。(为null会出现空指针异常)
——HashMap集合的key和value可以为null。
Hashtable集合的底层是哈希表/散列表的数据结构。
四、TreeMap集合
TreeMap集合底层是一个二叉树数据结构。
放到TreeMap集合中key部分的元素相当于放到TreeSet集合中。
TreeMap集合中存储元素的特点:与TreeSet相同,无序不可重复,元素可按照大小顺序自动排序,称为可排序集合。
放到TreeSet或者TreeMap集合key部分的元素要想做到自动排序,包括两种方式:
—— 第一种:放在集合中的元素实现java.lang.Comparable接口。
public class Person implements Comparable<Person> {
private int id;
private String name;
private String nickname;
private String gender;
private int age;
@Override
public int compareTo(Person o) {
// 指定规则:id的升序排列
// return this.getId() - o.getId();
}
}
—— 第二种:在构造TreeSet或者TreeMap集合的时候给它传一个Comparator比较器对象。
Collections.sort(users, new Comparator<Person>() {
// 临时指定对象的排序规则是:年龄由大到小
@Override
public int compare(Person o1, Person o2) {
return o2.getAge() - o1.getAge();
}
});
————当比较规则不会发生改变的时候,或者说当比较规则只有1个的时候,建议实现Comparable接口。
————如果比较规则有多个,并且需要多个比较规则之间频繁切换,建议使用Comparator接口。(Comparator接口的设计符合OCP原则。)