hash表的一点小小的总结

最新推荐文章于 2013-09-13 17:17:30 发布

60荷兰盾

最新推荐文章于 2013-09-13 17:17:30 发布

阅读量1.1k

点赞数

分类专栏：数据结构和算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mutex86/article/details/8955347

版权

数据结构和算法专栏收录该内容

38 篇文章 0 订阅

订阅专栏

在大数据和数据库的很多地方都会用到hash方法，hash方法由hash表，hash函数，冲突处理几大“硬件”组成。

这是july的博客，但是内容很多很杂，所以想结合书本中的内容做些简单的总结，供自己和大家随时复习一下！

一般我们查找都是通过二分查找，二叉排序树查找等等，这些查找都是要通过比较的，而且有些算法还是要比较很多次的，非常好的情况就是通过某种映射，直接找到要查找东西的地址。这听起来很诱人啊，无需多次比较，直接找到，省了多少事啊！这就是hash方法产生的动机。但是天下没有免费的午餐，hash也是要付出一定代价，但是这不妨碍它的广阔用途，比如说数据库中就用了很多hash。

1.什么是hash表？

hash表的实质就是一个数组，为什么要使用数组呢？因为数组有其他数据结构一个没有的优势，它可以立即寻址。只有立即寻址，才能体现hash的速度。这个数组里存的是什么呢？可以是要查找的内容（当然这种情况一般很少出现），还有一种就是该键值对应的数据的地址，简单的可以理解为数组中存的就是一个指针。

2.hash函数的构造方法

hash函数的意义就是通过key找到hash地址，再通过hash地址找到我们要的数据。

2.1直接定址法

取关键字或关键字的某个线性函数值为hash地址。即

H(key)= key 或 H(key) = a*key + b；

其中a和b为常数。

2.2数字分析法

书中举的例子就是，假如我们的Key是个长数字，分析哪些是重复的，选取不重复的位置作为hash地址。

2.3 平方取中法

就是取关键字平方后的中间几位为hash地址。

2.4 折叠法

将关键字分割成位数相同的几部分（最后一部分的位数可以不同），然后取这几部分的叠加和作为hash地址。这种方法适合于key的位数很多，而且key中每一位上数字分布大致相同。书中的例子是图书编号。

2.5 除留余数法

取关键字被某个不大于hash表表长m的数p除后所得余数为hash地址。即

H(key) = key MOD p ， p<= m

这是一种最简单，也最常用的构造hash函数的方法。这里的p的取法很有讲究，一般选p为质数或不包含小于20的质因子的合数。《算法导论》中提到p不能为2的n次方，这样会带来很多问题。但是有些人好像对这个提出了反对意见。知道的欢迎留言啊。

3处理冲突的方法

3.1开放地址法：

这是书里面的东西，懒得敲了。

3.2再hash法

就是要是遇到了冲突，用另外一个hash重新选择地址。

3.3链地址法

将所有关键字为同义词的记录存储在同一线性表中。

3.4建立一个公共溢出区

将所有冲突的都填入公共的溢出区。这种貌似没见用过。

4 hash的性能取决于：设计良好的hash函数，处理冲突的方法，装填因子。

装填因子 = 表中填入的记录数/hash表长度

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

60荷兰盾 CSDN认证博客专家 CSDN认证企业博客

码龄13年

75: 原创

13万+: 周排名

206万+: 总排名

37万+: 访问

: 等级

4444: 积分

59: 粉丝

53: 获赞

73: 评论

193: 收藏

私信

关注

热门文章

分类专栏

数据结构和算法 38篇
图像处理 19篇
opencv 8篇
汇编 5篇
模式识别 12篇
求职 3篇
数学 1篇
C++ 2篇
python 14篇
MySql 2篇

最新评论

ES+Kibana实时展示股票收益
CSDN-Ada助手: 非常感谢CSDN博主分享了关于ES+Kibana实时展示股票收益的技术文章，这篇博客讲解得非常详细，让人受益匪浅。我觉得可以在此基础上，推荐博主继续写一篇有关金融领域数据分析的文章，比如“利用Python进行股票实时监控与预测”，这样的技术文章对其他用户也会有很大的帮助。下一篇文章中，博主可以深入探讨金融数据分析的具体技术实现，相信会有更多读者受益于此。加油！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
傅里叶三角级数和复数表示的级数之间的转变
一江明月一江秋y: 这里三角级数前的系数 an ,bn，真的对应的是傅里叶变换FFT之后的复数组的实部和虚部吗？怎么感觉像是三角函数波信号的振幅呢？而振幅不就是实部平方+虚部平方的和再开根吗？有点迷茫了
import pandas 错误
Tdarlin: 牛蛙还真的有用
python代码加密
非著名架构师: 有界面,字节码级别,完全离线的 java混淆工具https://blog.csdn.net/a1ccwt/article/details/112185397
将一个整数逆序输出，分别给出递归和非递归算法
~o>_ 求教，为啥要设t_reverse,我不设编译也没问题呀

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。