目录
Set常用实现类如下
Set接口的特点:元素无序没有索引,元素不可重复
一、HashSet
1.HashSet底层是HashMap
2.添加一个元素,首先得到一个哈希值。
3.找到数据存储表table,看看表中有没有这个哈希值。
4.如果没有就插入元素
5.如果有,就根据eques方法判断是否相等,如果相等则放弃插入,否则在作为链表后面添加
6.如果链表的长度大于8且table的大小大于64就会变成红黑树
来看看源码,在调用HashMap的构造方法时new了一个HaspMap
public HashSet() {
map = new HashMap<>();
}
再来看看add方法,这里的PRESENT是一个Object的对象,用于存放value值
private static final Object PRESENT = new Object();
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
获得hash值,注意:这里不是直接获得hashcode,而是用了逻辑运算避免哈希冲突。
h >>> 16是用来取出h的高16(int 32位),(>>>是无符号右移) ^代表异或运算 ,为什么要用异或运算,而不是&或者|运算,因为要避免哈希冲突,^运算能够更好的保留两组数的特征
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
主要方法,代码较多,这里我就用注释逐行解释了
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
//定义辅助参数,没有实际意义。
Node<K,V>[] tab; Node<K,V> p; int n, i;
//如果HashMap第一次添加值,进入该判断
if ((tab = table) == null || (n = tab.length) == 0)
//第一次添加值,需要初始化容量,返回的是添加容量后的新节点Node赋值给tab
n = (tab = resize()).length;
//判断tab[i]节点是否已经有数据
if ((p = tab[i = (n - 1) & hash]) == null)
//节点没有插入过数据,直接将数据放入
tab[i] = newNode(hash, key, value, null);
//能进入这个判断,说明新节点的hash值和已有的冲突了(一致)这时要确定是否需要插入新节点作为链表
else {
Node<K,V> e; K k;
//通过 比较hash值和键值,如果键值不相等则比较重写equals方法的值,满足条件就放弃插入并新节点返回值
//主要做的事情是:如果和节点链表的第一个数据重复就插入失败,并返回数据
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//判断p节点是否是红黑树
else if (p instanceof TreeNode)
//如果是红黑树,就用红黑树的规则来插入,这里就不细看,在后面再研究
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
//新节点数据和该节点链表的数据不重复,且不是红黑树,接下来还要判断是否要插入新节点
else {
//对原节点上的链表循环
for (int binCount = 0; ; ++binCount) {
//当前节点为最后一个节点,且都与之前的链表比较判断过可以插入新节点
if ((e = p.next) == null) {
//将新节点插入链表的最后
p.next = newNode(hash, key, value, null);
//当前链表上的个数大于或等于了8个
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
//转红黑树,这里不是一定会树化,还要判断如果table的size大于了64才会树化,否则对table扩容
treeifyBin(tab, hash);
//新节点插入成功,退出循环
break;
}
//循环判断,如果满足条件就退出,放弃插入新节点
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
//新节点与链表上的数据重复放弃插入退出循环
break;
p = e;
}
}
//e!=null说明插入失败,只有一种情况插入失败,就是和原有节点数据重复了
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
//插入成功修改次数+1
++modCount;
//元素大小加1后超过了原有大小,扩容
if (++size > threshold)
resize();
//这个方法不做任何处理,留给子类去实现
afterNodeInsertion(evict);
//返回空则表示插入新节点成功
return null;
}
接下来我们看看数组扩容机制
1.HashSet底层是HashMap,第一次添加时table值添加到16,临界值是16*加载因子0.75 = 12
2.当数组超过加载因子,就会调用扩容方法,并且获得新的加载因子。loadFactor就是这个临界值
可以看到当++size > threshold条件满足后会进行扩容,注意:这里的size不是某个节点的链表节点数量,也不是数据元素个数,而是总节点数量,包括所有数据,每添加一个元素size就会+1。
二、LinkedHashSet
LinkedHashSet时HashSet的子类,底层是一个LinkedHashMap,维护了一个数组+双向链表。
在添加元素方法中使用的和HashSet同一个方法,唯一不同的是
if (++size > threshold)
resize();
afterNodeInsertion(evict);
LinkedHashSet重写了afterNodeInsertion方法
void afterNodeInsertion(boolean evict) { // possibly remove eldest
LinkedHashMap.Entry<K,V> first;
if (evict && (first = head) != null && removeEldestEntry(first)) {
K key = first.key;
removeNode(hash(key), key, null, false, true);
}
}
三、TreeSet
Set接口添加元素是无序的,TressSet的特点是,可以根据指定的循序排列。TreeSet的底层是TreeMap
TreeSet的构造方法
分析源码
public V put(K key, V value) {
Entry<K,V> t = root;
if (t == null) {
compare(key, key); // type (and possibly null) check
root = new Entry<>(key, value, null);
size = 1;
modCount++;
return null;
}
int cmp;
Entry<K,V> parent;
// split comparator and comparable paths
Comparator<? super K> cpr = comparator;
if (cpr != null) {
do {
parent = t;
cmp = cpr.compare(key, t.key);
if (cmp < 0)
t = t.left;
else if (cmp > 0)
t = t.right;
else
return t.setValue(value);
} while (t != null);
}
else {
if (key == null)
throw new NullPointerException();
@SuppressWarnings("unchecked")
Comparable<? super K> k = (Comparable<? super K>) key;
do {
parent = t;
cmp = k.compareTo(t.key);
if (cmp < 0)
t = t.left;
else if (cmp > 0)
t = t.right;
else
return t.setValue(value);
} while (t != null);
}
Entry<K,V> e = new Entry<>(key, value, parent);
if (cmp < 0)
parent.left = e;
else
parent.right = e;
fixAfterInsertion(e);
size++;
modCount++;
return null;
}
如果传入了Comparator比较器,就按Comparator内部类的compare方法的规则来排序,
否则按默认的方法排序。如果试图把一个对象添加到TreeSet集合中去,则该对象的类必须实现Comparable接口,否则将会抛出ClassCastException异常。