HashSet作为Set接口的实现类,它的底层还是基于HashMap来创建的。而HashSet拥有两个特点:1、插入元素的顺序和输出元素顺序与HashSet中的位置不一致。2、HashSet可以保证集合中的元素唯一。这篇文章主要针对HashSet的这个特点来详细讲解HashSet是如何在底层进行去重的。那么HashSet是如何去重的呢?
当我们在一个HashSet的对象中添加元素时,首先计算该元素的hashCode是否与HashSet中元素的hashCode相同,如果不相同,则直接添加到HashSet之中;如果两者的hashCode相同,则还需要接着比较该对象的equals()方法来检查两者是否真的相同;如果不同,则添加到HashSet中,如果相同,则证明两者真的相同,便不会将元素添加进去。
HashSet的add()方法源码如下:
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
通过源码我们发现HashSet中的add()方法实际上是在调用HashMap的put()方法,正是因为HashSet的底层实现逻辑是基于HashMap实现的,并且HashMap的键也不会重复的原因是HashMap的put()方法内部实现的。
HashMap的put()方法源码如下:
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
而put()方法又调用putVal()方法,它封装了HashMap的键不会重复的底层实现,也是HashSet不重复的特点的实现。
HashMap的putVal()源码如下:
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
从上述源码中可以看出,当向一个HashMap中插入键值对时,首先根据key的hashCode来确定Entry的存储位置,如果有两个key的hashCode相同时,则让这两个key进行equals()比较,如果两者的equals()相同,则不允许插入。