Hash表的实现原理

哈希表存在的意义

哈希表最重要的意义就是快速定位查找,类比来讲就是将Hash表就是将程序中毫无规律的数据项组合成了“新华字典”,根据“哈希表”可以快速找到字典中的每一个字。

哈希表(散列表)快速定位所需要的手段

哈希表目的就是为了使数据均匀分布同时保证计算简单,花费在计算地址上的时间要远小于遍历的时间。

两种散列函数

1直接定址法

在散列之前要知道所有的关键值,且数据之间对应的经过散列函数之后得到的值不能有冲突。(异想天开:只适用于小的数据分布)
这样的散列函数优点就是简单、均匀,也不会产生冲突,但问题是这需要事先知道关键字的分布情况,适合査找表较小且连续的情况。由于这样的限制,在现实应用中,直接定址法虽然简单,但却并不常用。

2除留余数法

根据关键值得取值范围去一个在其范围内最大的质数,这样可以更均匀的散列数据,同时也能减少冲突。(这种方法比较常用)

两种冲突处理的方法

1.开放定址法(线性探测):
公式为:

fi(key) = (f(key)+di) MOD m (di=1,2,3,......,m-1)

基本上属于顺序查找还有的空下来的位置
根据di的变化有两种不同的探测方法:
二次探测法:双向查找
随机探测发:随机分配,但是这时是伪随机,在查找时和插入用的是同一个随机数

如果发生冲突,这个位置数据项的指针指向下一个数据项的位置。也就是说同义词在一个链内。

2.拉链法
拉链法解决冲突的做法是:将所有关键字为同义词的结点链接在同一个单链表中。若选定的散列表长度为m,则可将散列表定义为一个由m个头指针组成的指针数组T[0..m-1]。凡是散列地址为i的结点,均插入到以T[i]为头指针的单链表中。T中各分量的初值均应为空指针。在拉链法中,装填因子α可以大于 1,但一般均取α≤1。
拉链法的优势与缺点

与开放定址法相比,拉链法有如下几个优点:

拉链法处理冲突简单,且无堆积现象,即非同义词决不会发生冲突,因此平均查找长度较短;
由于拉链法中各链表上的结点空间是动态申请的,故它更适合于造表前无法确定表长的情况;
开放定址法为减少冲突,要求装填因子α较小,故当结点规模较大时会浪费很多空间。而拉链法中可取α≥1,且结点较大时,拉链法中增加的指针域可忽略不计,因此节省空间;
在用拉链法构造的散列表中,删除结点的操作易于实现。只要简单地删去链表上相应的结点即可。而对开放地址法构造的散列表,删除结点不能简单地将被删结 点的空间置为空,否则将截断在它之后填人散列表的同义词结点的查找路径。这是因为各种开放地址法中,空地址单元(即开放地址)都是查找失败的条件。因此在用开放地址法处理冲突的散列表上执行删除操作,只能在被删结点上做删除标记,而不能真正删除结点。

拉链法的缺点:指针需要额外的空间,故当结点规模较小时,开放定址法较为节省空间,而若将节省的指针空间用来扩大散列表的规模,可使装填因子变小,这又减少了开放定址法中的冲突,从而提高平均查找速度。

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
哈希过滤器是一种常见的数据结构,它用于判断一个元素是否在一个集合中。它的主要原理是将元素映射到一个哈希中的一个位置,如果该位置上已经有元素了,就说明该元素可能在集合中,否则该元素一定不在集合中。 具体来说,哈希过滤器包括两个主要部分:哈希函数和位图。 哈希函数将元素映射到哈希中的一个位置,通常使用的是一些比较简单的函数,例如取模函数、乘法哈希函数、MurmurHash 等。 位图是一个二进制向量,它的每个元素都只能是0或1。哈希函数返回的值被用作位图中的下标,对应的位置上的值被设置为1,示该元素存在于集合中。当判断一个元素是否在集合中时,只需要将它经过哈希函数得到的位置在位图中查找,如果该位置的值为1,则该元素可能在集合中,否则一定不在集合中。 以下是一个简单的基于 C 语言的哈希过滤器的实现示例: ```c #include <stdlib.h> #include <stdint.h> #include <stdbool.h> #define FILTER_SIZE 1000 typedef struct { uint8_t *bits; size_t size; } filter_t; filter_t *filter_create(size_t size) { filter_t *filter = (filter_t *)malloc(sizeof(filter_t)); filter->bits = (uint8_t *)calloc(size, sizeof(uint8_t)); filter->size = size; return filter; } void filter_add(filter_t *filter, const void *key, size_t len) { size_t index = *((size_t *)key) % filter->size; filter->bits[index] = 1; } bool filter_contains(filter_t *filter, const void *key, size_t len) { size_t index = *((size_t *)key) % filter->size; return filter->bits[index] == 1; } void filter_destroy(filter_t *filter) { free(filter->bits); free(filter); } ``` 该实现中,`filter_t` 结构体包含一个 `bits` 数组和 `size` 属性,其中 `bits` 数组用于存储位图,`size` 属性示位图的大小。 `filter_create` 函数用于创建一个新的哈希过滤器,它接受一个参数 `size`,示位图的大小。 `filter_add` 函数用于将一个元素添加到哈希过滤器中,它接受两个参数,`key` 和 `len`,分别示要添加的元素和元素的长度。在该函数中,元素经过哈希函数得到一个下标 `index`,该下标对应的位置在位图中被设置为1,示该元素存在于集合中。 `filter_contains` 函数用于判断一个元素是否在哈希过滤器中,它接
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值