散列表——Hash Table

最新推荐文章于 2024-04-15 07:19:36 发布

Sudouble

最新推荐文章于 2024-04-15 07:19:36 发布

阅读量239

点赞数

分类专栏：代码精进之路文章标签：哈希表散列表

本文链接：https://blog.csdn.net/VVBBBBB/article/details/89428146

版权

代码精进之路专栏收录该内容

29 篇文章 1 订阅

订阅专栏

前文对数组和链表进行了分析，介绍了各自在插入、遍历、删除方面的优势和劣势，时间复杂度如下表示。

	数组	链表
读取	O(1)	O(n)
插入	O(n)	O(1)
删除	O(n)	O(1)

既然数组和链表都存在一定的不足，那么有没有什么方法能在快速读取的同时，可以快速的将数据插入呢？答案就是散列表！

场景

假设你开了一家超市，但还没有采购收银机器，于是在顾客结账的时候只能到价格列表上一个个查找。如果这个列表有序且商品数量不多，你只需要进行O(nlogn)次查找即可。可一旦顾客买了十几甚至几十种商品时，这就比较费劲了。一旦慢下来，后面那么长的队伍还在等着你呢，那么有没有什么办法能更快的做查询呢？一个好办法就是找一个熟记价格的营业员，对n件商品只需O（n）时间即可。那么问题又来了，怎么找到这么优秀的雇员呢？！接下来就要看散列表出场了！

定义&原理

定义：对于给定输入，能稳定的给出相应的输出（不能每次都不一样）。

那散列表又是如何存储的呢？为了达到理想的O(1)查找时间，能满足这个要求的非数组莫属了。但是数组是按照index进行索引，那又如何将输入的数字或字符串（如“book”、“mouse”等）转换为索引呢，即f(input)=index，且一个input对应一个唯一的index。这就是散列函数所要干的事情，有关的见SHA算法。

冲突

但是对于再优秀的散列函数，也可能存在有缺陷的地方，即存在多个给定输入，产生同一个输出的情况。之前MD5、SHA算法都已先后被攻破（新闻）。

缺陷归缺陷，当出现冲突的时候，是不是又可以用上其他方法来解决呢？常见的冲突解决方法有开放定址法，链地址法，建立公共溢出区等。实际的哈希表实现中，使用最多的是链地址法，如下。