在Object.hashCode()方法的JavaDoc中提到,对于hashCode方法的设计有三个要求:
- 同一对象的hashCode始终不变;
- 相等(equals方法)对象的hashCode相等;
- 不相等对象的hashCode尽可能不相等,这样可以提高哈希表的性能。
在最常用的Java类中,Integer/Long/Double都可以简单的计算出hashCode,这里以String为例作分析验证:
(注:Java的String.hashCode()方法所使用的哈希算法,在网络上被部分人称为BKDRHash算法,据说是最先在Brian Kernighan与Dennis Ritchie的《The C Programming Language》一书被展示而得名)
一、源码逻辑分析:
public int hashCode() {
int h = hash;
//因为哈希值稳定,已经计算过就不需要重新计算
if (h == 0 && value.length > 0) {
//字符串转换为字符数组
char val[] = value;
for (int i = 0; i < value.length; i++) {
//核心逻辑,循环所有字符,本字符乘以乘子后与下一字符相加
h = 31 * h + val[i];
}
//得到最后的hashCode
hash = h;
}
return h;
}
二、简单验证
针对String.hashCode的冲突率表现和乘子选择,使用英文字典文本(466544条单词)进行简单验证。
英文字典文本words.txt
测试代码如下:
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStreamReader;
import java.nio.charset.StandardCharsets;
import java.util.HashSet;
public<