为了一探究竟我建议先上源码(以set的add方法为例)如下所示:
原理hashSet底层是基于HashMap 来实现存储的,而set的 add方法其实调用的是map的put方法:
继续探究map的put方法看其实如何实现存储不重复元素的 :
可以看到在遍历table中的元素判断键和值,
1,如果hash码值不相同,说明是一个新元素,存储;
如果没有元素和传入对象(也就是add的元素)的hash值相等,那么就认为这个元素在table中不存在,将其添加进table;
2..1,如果hash码值相同,且equles判断相等,说明元素已经存在,不存;
2..2,如果hash码值相同,且equles判断不相等,说明元素不存在,存;
如果有元素和传入对象的hash值相等,那么,继续进行equles()判断,如果仍然相等,那么就认为传入元素已经存在,不再添加,结束,否则仍然添加;
可见hashcode()和equles()在此显得很关键了,下面就来了解一下hashcode和equles这两个方法:
首先要明确:只通过hash码值来判断两个对象时否相同合适吗?答案肯定是不合适的,因为存在两个元素的hash码值相同但是并不是同一个元素这样的情况;
那么要问什么是hash码值?
在java中存在一种hash表结构,它通过一个算法,计算出的结果就是hash码值;这个算法叫hash算法;
hash算法是怎么计算的呢?
是通过对象中的成员来计算出来的结果;
如果成员变量是基本数据类型的值, 那么用这个值 直接参与计算;
如果成员变量是引用数据类型的值,那么获取到这个成员变量的哈希码值后,再参数计算
如:新建一个Person对象,重写hashCode方法
public int hashCode() {
final int prime = 31;
int result = 1;
result = prime * result + age;
result = prime * result + ((name == null) ? 0 : name.hashCode());
return result;
}
可以看出,Person对象内两个参数name,age,hash码值是这两者计算后的记过,那么完全有可能两个对象name,age都不同,hash码值相同;
下面看下equles()方法:
public boolean equals(Object obj) {
if (this == obj)
return true;
if (obj == null)
return false;
if (getClass() != obj.getClass())
return false;
Person other = (Person) obj;
if (age != other.age)
return false;
if (name == null) {
if (other.name != null)
return false;
} else if (!name.equals(other.name))
return false;
return true;
}
equles方法内部是分别对name,age进行判断,是否相等。
因此在hashSet的add方法添加元素时,仅仅依靠hash值判断是否存在是不完全的 还要依靠equals方法。
如有披露或问题欢迎留言或者入群探讨