全面理解哈希函数及其应用

最新推荐文章于 2024-04-23 22:43:16 发布

energy_百分百

最新推荐文章于 2024-04-23 22:43:16 发布

阅读量7.9k

点赞数

分类专栏：数据结构文章标签：哈希 hash 散列哈希表 hashmap

本文链接：https://blog.csdn.net/lch551218/article/details/117753961

版权

4 篇文章 0 订阅

订阅专栏

1. 哈希函数

哈希函数是指一种能够讲任意数据转换为固定长度编码的一种函数，因为不同数据得到的哈希值可能相同，因此哈希过程一般是不可逆的，哈希函数可以应用于密码加密，哈希存储等方面。
好的哈西函数应该具备以下特点：

比如对用户密码的加密，如果使用明文来存储用户密码，那么管理员很容易就能在后台获取用户的密码并登录系统，如果通过哈希函数进行加密，那么管理员在后台只能看到通过哈希函数计算得到的哈希值，并且由于哈希函数不可逆的特性，管理员无法通过哈希函数得到用户密码的明文，从而对用户密码进行加密。

当然，用户一般不会设定太过于复杂的密码，因此黑客可以穷举常用的密码组合并计算相应的哈希值，然后和用户的哈希值进行一一比对，从而获取密码明文；当然实际密码加密过程往往更加复杂，也更难被破解，这里不展开讲。

哈希存储用一句话概括就是：将每个数据通过哈希函数编码成一个二进制编码，然后将这个二进制编码作为地址来保存这个数据

顺序表和链表在查找数据时，都需要从列表的第一个元素开始进行比对，直到检索到目标元素或者检索不到；而哈希存储可以根据源数据直接计算出数据的存储的地址，根据地址直接修改删除或校验数据即可，节省了数据比对的时间。

哈希表适用于那种查找性能要求高，数据元素之间无逻辑关系要求的情况。例如做文件校验或数字签名。当然还有快速查询功能的实现。

哈希是以 key-value的形式存储数据的，因此数据之间没有顺序，无法通过下标访问数据
占的空间大，牺牲空间换取了效率
当哈希表接近装满的状态时，性能下降得非常严重；因为当哈西表空间不足时需要执行扩容操作且扩容操作非常耗时。例如哈希表的长度是100，现在有第101个数要插入，这时，不仅哈希表的长度可能要扩展到150，且扩展之后所有的数都需要重新rehash。因此在设计哈希表时最好能够提前预知数据量的大小。

哈希函数的其他用用还包括：数据校验、版权校验、大文件分块校验、负载均衡、服务器缩容、服务器扩容、虚拟节点，具体的介绍请参考此文章->什么是 hash？ - 腾讯技术工程的回答 - 知乎

关注