HashSet类是如何实现添加元素保证不重复的---哈希码的原理

弄清怎么个逻辑达到元素不重复的,源码先上
HashSet 类中的add()方法:

public boolean add(E e) {
    return map.put(e, PRESENT)==null;
  }

类中map和PARENT的定义:

private transient HashMap<E,Object> map;
 // Dummy value to associate with an Object in the backing Map用来匹配Map中后面的对象的一个虚拟值
private static final Object PRESENT = new Object();

put()方法:

 public V put(K key, V value) {
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key.hashCode());
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }

可以看到for循环中,遍历table中的元素,
1,如果hash码值不相同,说明是一个新元素,存;

如果没有元素和传入对象(也就是add的元素)的hash值相等,那么就认为这个元素在table中不存在,将其添加进table;

2(1),如果hash码值相同,且equles判断相等,说明元素已经存在,不存;

2(2),如果hash码值相同,且equles判断不相等,说明元素不存在,存;

如果有元素和传入对象的hash值相等,那么,继续进行equles()判断,如果仍然相等,那么就认为传入元素已经存在,不再添加,结束,否则仍然添加;


可见hashcode()和equles()在此显得很关键了,下面就来解读一下hashcode和equles:

首先要明确:只通过hash码值来判断两个对象时否相同合适吗?答案是不合适的,因为有可能两个不同的对象的hash码值相同
什么是hash码值?
在java中存在一种hash表结构,它通过一个算法,计算出的结果就是hash码值;这个算法叫hash算法;
hash算法是怎么计算的呢?
是通过对象中的成员来计算出来的结果;
如果成员变量是基本数据类型的值, 那么用这个值 直接参与计算;
如果成员变量是引用数据类型的值,那么获取到这个成员变量的哈希码值后,再参数计算

如:新建一个Person对象,重写hashCode方法

public int hashCode() {
        final int prime = 31;
        int result = 1;
        result = prime * result + age;
        result = prime * result + ((name == null) ? 0 : name.hashCode());
        return result;
    }

可以看出,Person对象内两个参数name,age,hash码值是这两者计算后的记过,那么完全有可能两个对象name,age都不同,hash码值相同;
下面看下equles()方法:

public boolean equals(Object obj) {
        if (this == obj)
            return true;
        if (obj == null)
            return false;
        if (getClass() != obj.getClass())
            return false;
        Person other = (Person) obj;
        if (age != other.age)
            return false;
        if (name == null) {
            if (other.name != null)
                return false;
        } else if (!name.equals(other.name))
            return false;
        return true;
    }

equles方法内部是分别对name,age进行判断,是否相等。


综合上述,在向hashSet中add()元素时,判断元素是否存在的依据,不仅仅是hash码值就能够确定的,同时还要结合equles方法。

阅读更多

没有更多推荐了,返回首页