哈希 · Hash
概念的引入
哈希函数:
根据关键字直接计算出元素所在位置的函数
哈希表:
根据设定的哈希函数 H(key) 和处理冲突的方法将一组关键字映象到一个有限的连续的地址集(区间)上,并以关键字在地址集中的“象”作为记录在表中的存储位置,这种表便称为哈希表,这一映象过程称为哈希造表或散列,所得存储位置称为哈希地址或散列地址
总结的说,哈希即是通过一种计算方式,将每个值映射到一个唯一对应的键值
冲突:
两个不同的关键字具有相同的存储位置
影响冲突的因素:
1.装填因子:是指哈希表中己存入的元素个数 n 与哈希表的大小 m 的比值,即α=n/m
α越小,发生冲突的可能性越小,反之,发生冲突的可能性就越大
2.哈希函数:
构造好的哈希函数,使冲突尽可能的少
解决冲突的方法:
1.开放地址法
(1)线性探测法
设散列函数 H(K) = K mod m (m为表长),若发生冲突,则沿着一个探查序列逐个探查(也就是加上一个增量)
优点:只要哈希表未被填满,保证能找到一个空地址单元存放有冲突的元素;
缺点:可能使第i 个哈希地址的同义词存入第i+1 个哈希地址,这样本应存入第i+1个哈希地址的元素变成了第i