HashSet是根据类重写的hashcode和equals判断元素重复的,如果不进行重写就是用Object的原始hashcode和equals
Object的equals判断是判断两对象地址是否相等
对于Object来说,equals就是==判断
// equals源码
public boolean equals(Object obj) {
return (this == obj);
}
给一段示例代码
Object o1 = new Object();
Object o2 = new Object();
Object o3 = o1;
//false
System.out.println(o1.equals(o2));
//true
System.out.println(o1.equals(o3));
但我们创建对象的时候想根据某些字段值来判断是否相同
比如School,如果姓名和地址相同,我们就认定为同一个学校,如果用equals来判断,那么只要新建对象,Object的原始equals肯定是false,因为是两个不同对象不同地址,但实际上我们认为这两个对象是相同的
所以我们就要重写equals方法,只要某些字段相同,那么equals就认为他们是相同的。
但这也带来一些麻烦,因为Set查重的顺序是
- 先判断这个对象的hash值,如果hash不同,那么肯定不是一个对象。 这里我们就知道重写equals后为什么要重写hashcode,因为集合判断重复都是先根据hashcode判断。如果重写了equals,但hash还是用原始hashcode,那么就可能出现hashcode不同但equals判断相同,这就违背了集合判定。hashcode不同的话集合直接就认为是不同的,就不再往下进行equals方法了,所以就不同正确去重。
- 如果hashcode相同,那也不能保证相同,需要调用equals继续判断
- 如果equals也相同,那就判断为相同
// Set的add底层直接使用map.put(),value值为new Object()
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
// 初始化Map
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// 根据元素之前计算得出的哈希值,计算该元素在哈希表中的存储位置
// 如果该位置是null,表示为空,可以创建新的节点,存储元素
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
// 正菜
// 不为null说明存放位置有元素,判断并去重
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
如果hashcode相同且equals也相同,set就认为这两个对象相同,那么如果进行add就跳过
举个例子
如果我有一个Student类
public class Student {
private String No;
private String name;
private String classNo;
private Date updateTime;
}
现在我规定:如果No、name、classNo相同的,就是相同数据,updateTime不作为判断依据
那么我就会这样重写hashcode和equals方法
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
Student student = (Student) o;
return Objects.equals(No, student.No) && Objects.equals(name, student.name) && Objects.equals(classNo, student.classNo);
}
@Override
public int hashCode() {
return Objects.hash(No, name, classNo);
}
有选择性的进行重写即可