—— 哈希表 ( H a s h T a b l e ) (Hash~~Table) (Hash Table)作为一种高效的数据结构,它正在竞赛中发挥着越来越重要的作用。
简单解释:
我们使用一个下标范围比较大的数组来存储元素。可以设计一个函数( h a s h hash hash函数, 也叫做散列函数),使得每个元素的关键字都与一个函数值(即数组下标)相对应,于是用这个数组单元来存储这个元素;
构建hash函数:
常用的有以下几种方法:
- 除余法
取一个正整数m,用m去除关键码,取其余数作为地址,即: h ( K e y ) = K e y m o d m h(Key)= Key\mod m h(Key)=Keymodm
- 数字分析法
关键码的位数比存储区域的地址的位数多,在这种情况下可以对关键码的各位进行分析,丢掉分布不均匀的位留下分布均匀的位作为地址。
- 平方取中法
将关键码的值平方,然后取中间的几位作为散列地址。
- 折叠法
折叠法是将关键码从某些地方断开,分关键码为几个部分,其中有一部分的长度等于地址码的长度,然后将其余部分加到它的上面,如果最高位有进位,则把进位丢掉。
例: 如关键码Key=58422241,要求转换为3位的地址码。
分析:分如下3段:5 8 4 | 2 2 2 | 4 1,则相加:
5 8 4
2 2 2
4 1
8 4 7
h(Key)=84
冲突处理:
线性重新散列技术易于实现且可以较好的达到目的。
令数组元素个数为 S S S ,当 h ( k ) h(k) h(k) 已经存储了元素的时候,
依次探查 ( h ( k ) + i ) m o d S ( i ∈ N ∗ ) (h(k)+i) \mod S\quad (i\in N^*) (h(k)+i)