文章目录
java.lang.Object 类中hashcode() 方法的理解 - 类似于生成一个object的唯一标识符
所有的collection中的element都必须是object,所有object都会有一个native的hashcode() 方法。
这个方法继承自java.lang.Object类,返回一个hashcode值,这个值是根据这个object的内存地址生成的,是独一无二的(理论上,但实际应用中会出现hash冲突)。
什么是hash冲突?
哈希函数将输入数据映射到哈希码,然后使用哈希码来确定数据哈希表中的存储位置。由于哈希码的范围是有限的,可能会出现不同的输入映射到相同的哈希码上,这就是哈希冲突。因此,即使哈希码在理论上应该是唯一的,实际中在处理大量数据时,仍然可能会发生哈希冲突。
什么是hash函数/hash算法?
这两个术语通常来说是一个意思,是指将输入数据映射到固定长度的哈希码(hash code)的过程。
如何解决hash冲突?
哈希冲突是常见的情况,特别是在使用哈希表等哈希表数据结构时。为了解决哈希冲突,哈希表会采用链表、线性探测、二次探测等方法来处理多个键映射到相同槽位的情况。这样保证在哈希表中存储多个键值对,并正确处理不同哈希码的情况。
开放地址法(Open Addressing)是一种处理哈希冲突的方法,用于解决哈希表中不同键(对象)可能映射到相同槽位的情况。它是哈希表中的一种探测技术,当发生哈希冲突时,通过在哈希表中不断寻找空槽位来找到合适的位置存储冲突的要素。
- 线性探测(Linear Probing):逐个查找下一个槽位,即依次检查槽位
i+1, i+2, i+3, ...
,直到找到一个空槽位状态。 - 二次探测(Quadratic Probing):以二次方的增量查找下一个槽位,即依次检查槽位
i+1^2, i+2^2, i+3^2, ...
,直到找到一个空槽位状况。 - 双重哈希探测(Double Hashing):利用第二个哈希函数计算出增量,逐个查找下一个槽位,即依次检查槽位
i + h2(key)
,直到找到一个空槽位状况。
为什么对于引用对象不能使用==
而要使用equals()
因为 == 仅比较内存底地址,equal()比较的是内容
equals()方法执行过程
equals()方法如何判断返回true / false呢
1)用 ==
比较两个对象的内存地址,如果地址相同返回true;
2)若不相同,则继续比较对象内容的值,及两个不同的内存地址中存储的值是否相同,如果相同,则返回true;
3)否则返回false;
hashcode() 和 equals()的关系
equals() 比较返回true的两个对象的hashcode不一定相同;
但是hashcode相同的两个对象,equals() 一定返回true;
什么情况下需要重写hashcode() ?
重写hashCode()
方法是为了根据对象的内容来计算哈希码值而不是内存地址,从而保证内容相同的对象能够得到相同的hashcode。
如何高效重写Hashcode() ?
使用Object.hash() method 可以根据对象的属性生成对象的哈希码。
The method internally combines the hash codes of the individual objects using a hashing algorithm. Example:
@Override
public int hashCode() {
return Objects.hash(seq, id);
}
该hashCode()
方法用于Objects.hash(...)
根据属性seq
和计算哈希码id
。该Objects.hash(...)
方法在内部负责以有效的方式组合这些属性的哈希码,确保具有相同值的对象seq
和id
将具有相同的哈希码。
为什么二者一定要同时重写?
将object存入hash collection的时候发生了什么?
因为equals() 效率较低,所以object存入hash collection时,会直接取模得到存储的index然后找到对应的槽位:
- 如果该index对应的槽位为空,说明没有hash collision,会直接存入不再进行equals比较;
- 如果该槽位非空,则会用equals()判断是否内容真的相等,如果相等则不会重复存储,如果不相等,说明存在hash collision, 所以会采用链表(例如红黑树)、open addressing等方法来解决。
因为如果只重写equals() 方法,但是hashcode()不重写,可能会出现equals()相同,但是hashcode() 却不同的情况。
这样会导致hashmap(), hashset()等存入两个内容相同的数据,违背hash collection的元素唯一性原则。
Example
这里节选自我写的6.824lab - 重新定义了一个BallotNum class, 重写了equals()和hashCode()方法
@Data
class BallotNum implements Serializable{
private final Integer seq;
private final Integer id;
public boolean greaterThan(BallotNum other) {
if (other == null){
return true;
}
if (other.seq < seq){
return true;
}else if(other.seq == seq && other.id <id){
return true;
}
return false;
}
@Override
public boolean equals(Object o) {
if (o == this) {
return true;
}
if (!(o instanceof BallotNum)) {
return false;
}
BallotNum other = (BallotNum) o;
return Objects.equals(seq, other.seq) && Objects.equals(id, other.id);
}
@Override
public int hashCode() {
return Objects.hash(seq, id);
}
}