Java中HashSet去重的实现原理

最新推荐文章于 2024-08-04 17:33:04 发布

卡多希y

最新推荐文章于 2024-08-04 17:33:04 发布

阅读量1.4k

点赞数 3

分类专栏： Java 文章标签： java javase eclipse idea

本文链接：https://blog.csdn.net/qq_17845335/article/details/125646977

版权

Java 专栏收录该内容

19 篇文章 0 订阅

订阅专栏

HashSet作为Set接口的实现类，它的底层还是基于HashMap来创建的。而HashSet拥有两个特点：1、插入元素的顺序和输出元素顺序与HashSet中的位置不一致。2、HashSet可以保证集合中的元素唯一。这篇文章主要针对HashSet的这个特点来详细讲解HashSet是如何在底层进行去重的。那么HashSet是如何去重的呢？

当我们在一个HashSet的对象中添加元素时，首先计算该元素的hashCode是否与HashSet中元素的hashCode相同，如果不相同，则直接添加到HashSet之中；如果两者的hashCode相同，则还需要接着比较该对象的equals()方法来检查两者是否真的相同；如果不同，则添加到HashSet中，如果相同，则证明两者真的相同，便不会将元素添加进去。

HashSet的add()方法源码如下：

  public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }

通过源码我们发现HashSet中的add()方法实际上是在调用HashMap的put()方法，正是因为HashSet的底层实现逻辑是基于HashMap实现的，并且HashMap的键也不会重复的原因是HashMap的put()方法内部实现的。

HashMap的put()方法源码如下：

 public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }

而put()方法又调用putVal()方法，它封装了HashMap的键不会重复的底层实现，也是HashSet不重复的特点的实现。

HashMap的putVal()源码如下：

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

从上述源码中可以看出，当向一个HashMap中插入键值对时，首先根据key的hashCode来确定Entry的存储位置，如果有两个key的hashCode相同时，则让这两个key进行equals()比较，如果两者的equals()相同，则不允许插入。