哈希表

最新推荐文章于 2024-04-19 20:13:15 发布

我一定要成为架构师

最新推荐文章于 2024-04-19 20:13:15 发布

阅读量135

点赞数

分类专栏：数据结构

本文链接：https://blog.csdn.net/weixin_43907332/article/details/90805754

版权

13 篇文章 0 订阅

订阅专栏

引入哈希表

前面查询方法共同特点：通过将关键字值与给定值比较，来确定位置。效率取决比较次数。理想方法是：不需要比较，根据给定值能直接定位记录的存储位置。这样，需要在记录的存储位置与该记录的关键字之间建立一种确定的对应关系，使每个记录的关键字与一个存储位置相对应。

hashtable 也叫做散列表
特点：快
结构：结构有多种
最流行、最容易理解；顺序表+链表
主结构：顺序表
每个顺序表的节点在单独引出一个链表
在这里插入图片描述

和添加数据的过程使相同的
结论1：哈希表查询数据快
结论2：哈希表删除数据快
结论3：哈希表更新数据快（如果更新后影响到哈希码值，就比较繁琐了，比如要删除再添加了）

hashCode（）：计算哈希码，是一个整数，根据哈希码计算出数据再哈希表中的存储位置
equals：添加时出现了冲突，需要通过equals进行比较，判断是否相同，查询时也需要使用equals进行比较，判断是否相同。

int：取自身看Integer源码
double：3.14 3.15 3.145 6.567 9.87 取整不可以看Double源码
String java oracle j+a+v+a 将各个字符的编码值相加不可用
abc cba bac a：97 b：98 c：99
abc：197+298+399
cba：199+298+397
Student先各个属性的哈希码，进行某些相加相乘的运算
int id
String name
int age
double score；

哈希表的长度和表中的记录数的比例——填充因子
如果Hash表的空间远远大于最后实际存储的记录个数，则造成了很大的空间浪费，如果选取小了的话，则容易造成冲突。在实际情况中，一般需要根据最终记录存储个数和关键字的分布特点来确定Hash表的大小。还有一种情况可能是先不知道最终需要存储的记录个数，则需要动态维护Hash表的容量，此时可能需要重新计算Hash地址。
**装填因子=表中的记录数/哈希表的长度，**如果装填因子越小，表明表中还有很多的空单元，则添加发生冲突的可能性越小；而装填因子越大，则发生冲突的可能性就越大，在查找时所耗费的时间就越多。有相关文献证明当装填因子在0.5左右的时候，Hash的性能能够达到最优。因此，一般情况下，装填因子取经验值0.5
哈希函数的选择
直接定址法平方取中法折叠发除留取余法（y=x%11）查询相关资料
处理冲突的方法
链地址法开放地址法再散列法建立一个公共溢出区