系列文章目录
前面写了Collection接口下的List接口,今天我们来说一下Set接口下的实现类HashSet
本文章基于jdk11
前言
前面整理了Collection接口下的List接口及其实现类,今天来讲一下Set接口。
提示:HashSet底层实现就是一个HashMap!!!
一、Set接口的特点?
1、Set接口是无序集合,即加入顺序和取出顺序不一致(取出顺序不会随机变化,多次取出返回顺序一致);
2、Set接口内部元素不可重复,允许存在null值
3、Set接口的主要实现类:HashSet和TreeSet,下面是他的继承示意图,可以看到Set接口也是继承了Collection接口,从而可以得知:遍历Set集合时,也可使用Iterator迭代器或者增强for
二、HashSet源码解读
2.1 new HashSet()方法
我们新建一个Set集合
Set set = new HashSet();
set.add("java");
set.add("json");
set.add("java");
set.add(4);
跟进HashSet的构造方法,发现其底层是由一个HansMap实现的
public HashSet() {
map = new HashMap<>();
}
再次跟进new HashMap<>();
public HashMap() {
//他在这里设置了一个加载因子,其中DEFAULT_LOAD_FACTOR=o.75f
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
2.2 add()方法
在set.add(1);,设置断点,跟进方法内部,发现如下代码
public boolean add(E e) {
//在此处调用了一个map的put方法,我们可以通过代码得知这是一个HashMap,所以底层调用的是HashMap的put()方法
//private static final Object PRESENT = new Object();HashSet中的一个静态属性,不可更改,共享
return map.put(e, PRESENT)==null;
}
跟进map.put(e, PRESENT)
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
我们先跟进其中 的hash(key)方法
static final int hash(Object key) {
int h;
//我们传入的元素作为Key,进行hash运算后与右侧(h >>> 16)进行异或运算,得到key的运算值
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);//>>>指无符号右移,忽略符号位,空位都以0补齐
}
再跟进putVal(hash(key), key, value, false, true);方法,这个方法极其重要,我会在代码中注释解读
在跟进代码后,我们要先介绍一个重要的对象,就是Node<K,V>,可以叫他结点对象,这就是HansMap存储数据的基本单位,他是HashMap的一个静态内部类。
**这里我要先告诉大家结论:HashMap底层存储数据的原理:
1、HashMap底层维护的是一个数组加单向链表的形式,Node<K,V>结点对象就是我们存储数据的最小单位,每一个数组的 索引位置对应的就是一个单向链表,每个链表上保存的就是我们的Node<K,V>结点,大概如图:
2、HashMap在第一次添加数据时,底层先把table数组的大小扩容到16,而添加元素时,经过上述的hash运算得到对应的hash值
3、当table数组使用到达临界值(16*0.75=12)时,数组就会进行2倍扩容,这里的0.75是加载因子,我们过会儿讲源码
4、当table数组达到64且一条链表上的元素到达8个时,该链表就会树化为一颗红黑树**
Node<K,V>的部分代码如下
static class Node<K,V> implements Map.Entry<K,V> {
//一个hash值
final int hash;
//传入的key
final K key;
//传入的value
V value;
//一个新的结点next
Node<K,V> next;
//构造方法
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
//hash:key经过运算后的hash值,key:我们传入的元素,value:就是PRESENT,这个是一个静态值,指向同一个对象
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
//先把tab指向table的内存地址,并判断table是否为null,这里table的初始值就是一个空的Node<K,V>[]数组
if ((tab = table) == null || (n = tab.length) == 0)
//进入resize方法--》我们直接跳转进来查看,见代码块resize();(下面紧挨的代码分析)
n = (tab = resize()).length;//得到一个大小为16的(Node<K,V>[])new Node[newCap];
//进行hash运算之后的到当前元素对应的索引位置上的元素,判断是否为null,为null则代表此处没有相同数据
if ((p = tab[i = (n - 1) & hash]) == null)
//给当前位置进行赋值,存入我们传进来的元素
tab[i] = newNode(hash, key, value, null);
else {
Node<K