【数据结构】查找——散列表（哈希表小总结附例题）

Soul:

已于 2023-11-09 07:58:46 修改

阅读量1.2k

点赞数

分类专栏：【数据结构】—查找文章标签：散列表数据结构哈希算法

于 2022-11-14 17:18:28 首次发布

本文链接：https://blog.csdn.net/qq_43581971/article/details/127837487

版权

【数据结构】—查找专栏收录该内容

5 篇文章 0 订阅

订阅专栏

散列表

写在前面：

线性表、树表的查找方法基于关键字的比较为基础。当关键字多得不像话了怎么办？？
有木有一种方法可以在「元素的存储位置」和「关键字」之间建立某种关系，使得我很快就能找到关键字的家（在存储结构中的位置）呢？
有的，这就是散列表的思想：实现「关键字」—>「地址」的直接转换方法，无需反反复复比较。

1 散列表的一些概念

散列表（Hash Table），又叫哈希表，通常存储空间是个一维数组，散列地址是数组的下标。
特点：数据元素的关键字与其存储地址直接相关。
冲突：两个或两个以上的不同关键字映射到同一地址。（可以理解为别人和你抢地盘），是多对一的映射。这些相同函数值的关键字称为同义词。
冲突不可避免，但可以「选择一个好的散列函数」、「设计好处理冲突的方法」来尽可能减少冲突。

如何构造散列函数？？
如何处理冲突？？

2 散列表的构造方法

构造散列函数要注意：

定义域须包括全部关键字，值域依赖于散列表的大小或地址范围。
为***减少冲突***，散列函数计算出来的地址应等可能、均匀分布。
散列函数应***简单***、短时间内能够计算出相应的散列地址。

2.1 直接定址法

适合关键字分布基本连续的情况。

2.2 除留余数法

散列函数：

H( key ) = key % p
散列表长为 m，p < = m，其中 p 是最接近 m 的质数。
比如表长13，p 为13；表长15，p 为13；表长为100，p 为97。
（质数：只有 1 和它本身两个因子。如果是合数，公因子很多，有很多相似的特征，会较容易发生冲突）
特征：关键是选好 p ，是每个关键字等概率映射到地址上，尽可能减少冲突。