哈希表HashTable
0.前言
前面的文章我们分析了符号表的集中实现方式:有序链表、无序数组、二叉搜索树(BST)、平衡搜索树(红黑树法)等,通过下图回忆一下各种实现方法的性能对比。
那么,除此之外,是否还存在性能更好的实现方法呢?答案是肯定的,就是本文将重点介绍的哈希表(HashTable)。
1.哈希函数
哈希表就是使用一个key-indexed的表来存储数据,其中该index是对key使用哈希函数计算的结果。(如下图所示)
哈希存在以下三个注意事项:
- 哈希容易运算
- 相等性检测:能够通过哈希运算检测两个输入值是否相等
- 冲突解决:能够解决哈希冲突的情况。哈希冲突是指当两个不同的输入经过哈希运算的结果相同的index时
所以,哈希函数的目标是:均匀地为每一个key产生一个index,具体体现在:
- 高效的运算
- 一个index等可能地服务于一个key(理想情况下,一个key只产生一个index)
hashCode
在Java中,每一个类都继承了hashCode()方法,该方法会返回一个32bit的整型数据。
默认情况下,hashCode(x)返回的是x在内存中的地址,用户可以通过重写hashCode()方法改变这一规则。在Java库里,hashCode()的实现如下:
//Integer,整型本身就可以作为index,故返回本身
public final class Integer{
private final int value;
...
public int hashCode(){
return value; }
}
//Boolean,布尔值只有两种情况,故只需返回两个index
public final class Boolean{
private final boolean value;
...
public int hashCode(){
if (value) return 1231;
else return 1237;
}
}
//Double
public final class Double{
private final double value;
...
//先转成64bit的形式,然后进行位异或,最后返回强转整型的index值
public int hashCode(){
long bits = doubleToLongBits(value);
return (int) (bits ^ (bits >>> 32));
}
}
//String,先将字符串拆成字符数组,然后使用公式:h = s[0]·31^L–1+ … +s[L–3]·312 +s[L–2]·31^1 +s[L–1]·31^0.
public final class String{
//为了方便,可以先将结果缓存(因为String是immutable的)
private int hash = 0;
private final char[] s;
...
public int hashCode()