博主前面的文章Java HashMap实现原理0——从hashCode,equals说起有提HashMap是由散列表实现,但是没介绍,觉得只是个数据结构,清楚大概就行,直到前几天某厂的一道笔试题,让实现一个自定义的HashMap,作者蒙逼了,手撸代码犯怂。今天就带大家看下散列表的原理以及具体要求下的实现。
散列表(Hash Table,也叫哈希表),是根据关键码值 (Key-Value) 而直接进行访问的数据结构。也就是说,它通过把关键值映射到表中一个位置来访问记录,以加快查找的速度。哈希表的实现主要需要解决两个问题,哈希函数和冲突解决。
哈希函数
散列表内部,我们使用桶(bucket)来保存键值对,每个桶都有一个编号,编号决定了给定的键存于散列表的哪个桶中。散列表拥有的桶数被称为散列表的容量(capacity)。假设现在有编号0~M-1,共计M个桶,哈希函数的功能就是把给定的key,映射到[0,M-1]区间的某个值。对哈希函数有两个要求:计算时间短;不同的键得到的结果尽可能均匀的分布在桶号区间内。不同的Key的集合,使用不同的哈希函数才能达到效果。
设计一个较好的散列函数是不容易的,但通常我们无需设计它,可以直接采用基于概率统计的高效实现,比如Java中不少类复写了hashCode方法,该方法返回一个hashCode,该值对容量M进行取余,即可获得一个桶号。下面看几个类的hashCode()实现。
1.String类的hashCode
@Override
public int hashCode() {
int hash = hashCode;
if (hash == 0) {
if (count == 0) {
return 0;
}
for (int i = 0;