从原理了解Hash

最新推荐文章于 2023-02-05 23:14:47 发布

Veiu咩羊

最新推荐文章于 2023-02-05 23:14:47 发布

阅读量618

点赞数

分类专栏：数据结构与算法文章标签：算法哈希表 hash 哈希散列表

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Tiooo111/article/details/106381217

版权

Hash

它是什么？

哈希表是又称散列表，一种以 “key-value” 形式存储数据的数据结构。所谓以 “key-value” 形式存储数据，是指任意的 key 都唯一对应到内存中的某个位置。只需要输入查找的值 key，就可以快速地找到其对应的 value。可以把哈希表理解为一种高级的数组，这种数组的下标可以是很大的整数，浮点数，字符串甚至结构体。

为什么存在？

有时关键码空间的数量级可能远远大于实际问题的空间，造成了巨大的浪费，我们使用桶(bucket)直接存放或间接指向一个词条。

优缺点？

优点:

>>>空间利用率：

问题空间N，关键码空间R，桶数组(bucket array)或散列表(hash table),容量为M，则：

N < M << R

空间 = O( N + M )=O(N)

M尽可能与N同阶，所以至少与使用关键码空间相比空间利用率大大的提高了。

>>>常数级的查找时间：

因为哈希表遵循的是循值访问，所以查找时间只需要O(1)，这是再好不过的了。

缺点：

>>>冲突：

hash(key) = key % M
冲突是无法避免的，但是我们可以尽量减少冲突，并从以下两个方向入手：

精心设计散列表及散列函数，以尽可能降低冲突的概率；
制定可行的预案，以便在发生冲突时，能够尽快予以排解。

怎么用？

>>>循值访问

>>>散列函数的设计：

除余法：hash(key) = key % M

M应当选取素数。步长为step，gcd(step,M)=G,当且仅当 G == 1时，足迹能够遍布整个散列表。又由于step不能确定，所以M应是一个素数。

MAD法 (multiply-add-divide) ：hash(key) = ( a * key + b ) % M

除余法有两个缺陷。

一：它有不动点。无论表长M取值如何，总有hash(0) ≡ 0

二：零阶均匀。[ 0 ,R)的关键码，平均分配至M个桶；但相邻的关键码的散列地址也比相邻。

取M为素数，a > 0，b > 0，a % M != 0。hash(key) = ( a * key + b ) % M

平方取中 (mid-square) ：取 key^2的中间若干位，构成地址

原理：将平方运算分解为一系列的左移操作，以及若干次加法，思想类似于快速幂,如13^2=13 + (13)<<2 + (13)<<3。如果忽略进位，每个数位都是由原关键码若干次求和得到的，因此两侧的数位是由更少的原数位累积而得，而越是居中的数位是由更多的原数位累积，截取居中的若干位，可以使得原关键码各数位对最终地址的影响彼此更为接近。

多项式法：
$hash( s = x_0，x_1，x_2，···，x_{n-1} ) = x_0*a^{n-1} + x_1*a^{n-2} + ··· + x_{n-2}*a^1 + x_{n-1}$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
从原理了解Hash

Hash它是什么？哈希表是又称散列表，一种以 “key-value” 形式存储数据的数据结构。所谓以 “key-value” 形式存储数据，是指任意的 key 都唯一对应到内存中的某个位置。只需要输入查找的值 key，就可以快速地找到其对应的 value。可以把哈希表理解为一种高级的数组，这种数组的下标可以是很大的整数，浮点数，字符串甚至结构体。为什么存在？有时关键码空间的数量级可能远远大于实际问题的空间，造成了巨大的浪费，我们使用桶(bucket)直接存放或间接指向一个词条。优缺点？优点
复制链接

扫一扫

专栏目录

Veiu咩羊 CSDN认证博客专家 CSDN认证企业博客

码龄5年

4: 原创

19万+: 周排名

169万+: 总排名

1万+: 访问

: 等级

227: 积分

10: 粉丝

32: 获赞

24: 评论

43: 收藏

私信

关注

热门文章

分类专栏

最新评论

算法训练网络流裸题
Lmonan: 同问！
算法训练网络流裸题
云澈丿: 能帮帮忙解释一下题意嘛。。。
算法训练网络流裸题
Veiu咩羊: 假如说点v到点u有一条边边的权值是x，i->first就是u，i->second就是x 如果这个点还没用过而且x大于0，那么就把u的前驱设置为v，也就是说说明了点u是从点v走来的，然后把流到点u的流量设置成流到点v的流量和x中最小的，并把u入队列，之后对u做等同与v的工作
算法训练网络流裸题
与人.ޓ: if(!a[i->first]&&i->second>0){ pre[i->first]=v; a[i->first]=min(a[v],i->second); que.push(i->first); } 老哥这段代码不太懂啊。。。太多箭头了，我不是学c++的，求解释下，多谢！！
算法训练网络流裸题
Veiu咩羊: 你是说输入的那个嘛，是题目给的数据，数据里面有重复的

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。