当前博客用于分析当使用add方法向集合中添加重复元素时的情况,建议查看前先去浏览上篇博客详述HashSet类add方法(一)
HashSet集合中不允许元素重复,这是如何实现的呢?
下面我们一起分析一下:
public class Test {
public static void main(String[] args) {
HashSet<String> set=new HashSet<String>();
set.add(str1);
set.add(str2);
}
}
这次我们直接从putVal方法开始分析:
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
第4行代码先将全局变量table赋值给局部变量tab,但是由于table是全局变量,所以储存的是上次添加元素时newTab数组的地址,数组中存储着上一次添加进去的元素,所以不为null,表达式(tab = table) == null为false,再看逻辑或运算符后面的表达式,将tab数组的长度赋值给n,因为第一次存储数据时已经把16赋值给了n,n不为0,所以表达式为false,if的判断条件不成立,执行第6行。
第6行代码将n-1与hash进行按位与运算,因为String类中只要字符串内容相同,hashCode方法打印的数字便相同,而hash方法的返回值调用了hashCode方法,所以只要传入hashCode方法的字符串相同,得到的结果就是一样的。又因为我们两次传入的key都是"Tom",所以两次获得的hash值相同,所以计算出的i值也相同,也就是说两次添加元素的位置相同,因为第i个结点中已经保存了第一次传入的元素,所以不为null,那么if判断条件自然不成立,执行第8行的else代码块。
第10、11行代码这是一个逻辑与运算式,先看运算符前面的表达式,再第6行已经把第一次添加元素结点的地址赋值给了p,所以p.hash就是第一个元素的hash,所以运算符前面的表达式为true,再看运算符后面的逻辑或表达式,将p结点的key值赋值给k,也就是第一次添加的“Tom”,而==后面的key是本次添加的“Tom”,等号运算符比较的是二者的地址,又因为二者都是直接赋值创建的对象,所以都是存储在堆中的常量池中,地址也是相同的,所以该表达式为真,逻辑或表达式也为真,前面的逻辑与表达式也为真,所以该if判断条件成立,执行if代码块,这种方式为判断直接赋值的String对象;若是以不同方式创建的两个String对象,字符串内容相同,传入add方法中,则用逻辑或运算符后的表达式进行判断,先判断其是否为null,不为null时,再调用String中equals方法比较二者的字符串内容是否一致,这里显然是第一种情况
第12行代码p将第一次添加结点的地址赋值给e
第29行:因为e中存储的是第一次添加的结点,不为null,所以if判断条件成立,执行if代码块。
第31行:onlyIfAbsent是该方法传入的第四个参数,由put方法传入的是一个false,所以逻辑非之后是一个true,由于该表达式是逻辑或,所以直接得出if判断条件成立,执行if代码块。
第32行:将第一次添加结点中的value值覆盖为本次value,因为value是一个常量,所以在HashSet中无影响。
第34行:返回oldValue值,也就是第一次添加的value常量,到上一级的put方法中,putVal方法结束。
put方法再将该value常量返回给上一级的add方法,因为put的返回值不为null,所以add返回一个false,第二个字符串"Tom"添加失败。
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}