c++面试摘录（二） unordered_map和map的底层原理

五条悟

已于 2024-03-12 14:52:10 修改

阅读量9.2k

点赞数 9

分类专栏： c++面经文章标签：散列表数据结构哈希 b树

于 2022-03-11 15:11:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_61207303/article/details/123402294

版权

c++面经专栏收录该内容

13 篇文章 5 订阅

订阅专栏

unordered_map的底层就是一个散列表（哈希表）

散列表又叫哈希表，是能够通过给定的关键字的值直接访问到具体对应的值的一个数据结构。也就是说，把关键字映射到一个表中的位置来直接访问记录，以加快访问速度。

通常，我们把这个关键字称为 Key，把对应的记录称为 Value，所以也可以说是通过 Key 访问一个映射表来得到 Value 的地址。而这个映射表，也叫作散列函数或者哈希函数，存放记录的数组叫作散列表。

目前，这个哈希函数比较常用的实现方法比较多，通常需要考虑几个因素：关键字的长度、哈希表的大小、关键字的分布情况、记录的查找频率，等等。

下面简单介绍几种哈希函数。

直接寻址法：取关键字或关键字的某个线性函数值为散列地址。

数字分析法：通过对数据的分析，发现数据中冲突较少的部分，并构造散列地址。例如同学们的学号，通常同一届学生的学号，其中前面的部分差别不太大，所以用后面的部分来构造散列地址。

平方取中法：当无法确定关键字里哪几位的分布相对比较均匀时，可以先求出关键字的平方值，然后按需要取平方值的中间几位作为散列地址。这是因为：计算平方之后的中间几位和关键字中的每一位都相关，所以不同的关键字会以较高的概率产生不同的散列地址。

取随机数法：使用一个随机函数，取关键字的随机值作为散列地址，这种方式通常用于关键字长度不同的场合。

除留取余法：取关键字被某个不大于散列表的表长 n 的数 m 除后所得的余数 p 为散列地址。这种方式也可以在用过其他方法后再使用。该函数对 m 的选择很重要，一般取素数或者直接用 n。

对散列表函数产生冲突的解决办法

散列表为什么会产生冲突呢？前面提到过，有时不同的 Key 通过哈希函数可能会得到相同的地址，这在我们操作时可能会对数据造成覆盖、丢失。之所以产生冲突是由于哈希函数有时对不同的 Key 计算之后获得了相同的地址。

冲突的处理方式也有很多，下面介绍几种。

开放地址法（也叫开放寻址法）：实际上就是当需要存储值时，对Key哈希之后，发现这个地址已经有值了，这时该怎么办？不能放在这个地址，不然之前的映射会被覆盖。这时对计算出来的地址进行一个探测再哈希，比如往后移动一个地址，如果没人占用，就用这个地址。如果超过最大长度，则可以对总长度取余。这里移动的地址是产生冲突时的增列序量。

再哈希法：在产生冲突之后，使用关键字的其他部分继续计算地址，如果还是有冲突，则继续使用其他部分再计算地址。这种方式的缺点是时间增加了。

链地址法：链地址法其实就是对Key通过哈希之后落在同一个地址上的值，做一个链表。其实在很多高级语言的实现当中，也是使用这种方式处理冲突的，我们会在后面着重学习这种方式。

建立一个公共溢出区：这种方式是建立一个公共溢出区，当地址存在冲突时，把新的地址放在公共溢出区里。

而C++ STL 标准库中，不仅是 unordered_map 容器，所有无序容器的底层实现都采用的是哈希表存储结构。更准确地说，是用“链地址法”（又称“开链法”）解决数据存储位置发生冲突的哈希表。

map的底层就是一个红黑树（平衡二叉B树）

首先要了解红黑树先要了解平衡二叉树即AVL树

(21条消息) AVL树（平衡二叉树）的底层原理以及实现_杨580的博客-CSDN博客

AVL的左右子树高度差不能超过1，每次进行插入/删除操作时，几乎都需要通过旋转操作保持平衡

在频繁进行插入/删除的场景中，频繁的旋转操作使得AVL的性能大打折扣

红黑树通过牺牲严格的平衡，换取插入/删除时少量的旋转操作，整体性能优于AVL

红黑树插入时的不平衡，不超过两次旋转就可以解决；删除时的不平衡，不超过三次旋转就能解决

红黑树的红黑规则，保证最坏的情况下，也能在O ( l o g 2 N ) 的时间内完成查找操作

红黑树的规则特性：

节点分为红色或者黑色；
根节点必为黑色；
叶子节点都为黑色，且为null；
连接红色节点的两个子节点都为黑色（红黑树不会出现相邻的红色节点）；
从任意节点出发，到其每个叶子节点的路径中包含相同数量的黑色节点；
新加入到红黑树的节点为红色节点；

我认为面试的话用不到手撕红黑树，只需要记一些特性，如果需要详细了解红黑树，就自己在去查一些资料，这里就不详细介绍了。

2023.03.16更新：离上次面试已经过去几个月了，补充一下，面试问题：

如何计算红黑树的内存？

关注

9
点赞
踩
35

收藏

觉得还不错? 一键收藏
0
评论
c++面试摘录（二） unordered_map和map的底层原理

unordered_map和map的底层原理
复制链接

扫一扫

专栏目录

五条悟 CSDN认证博客专家 CSDN认证企业博客

码龄3年

上海立芯软件科技有限公司

30: 原创

5万+: 周排名

12万+: 总排名

5万+: 访问

: 等级

389: 积分

276: 粉丝

42: 获赞

26: 评论

176: 收藏

私信

关注

热门文章

分类专栏

最新评论

QT qlineargradient 设置背景渐变
宁宝是第一: 应用商店那个组件是什么呀
2022西山居seed游戏开发训练营笔试复盘
Koroz_xyl: 这个是和考试一样吗什么文档都看不了吗
2022西山居seed游戏开发训练营笔试复盘
Koroz_xyl: 笔试都是线上吗
QT QComboBox+QTreeView 实现二级或多级菜单并带滚轮
prefectsli: 怎样可以限制只能选择treeview的叶子节点？
面试问题摘录（一）c++类对象的初始化顺序
星象巷: 构造函数的执行顺序首先是如果存在继承关系那就从最开始的基类调用，比如C继承自B，B继承A，那么调用构造函数的顺序就是A->B->C,因为C的构造函数不负责初始化类当中的基类部分，对于多继承的情况则按照声明继承的顺序调用，比如class C: public A, public B，则会首先调用A的，在考虑B的情况；之后类本身的构造函数会来初始化类当中的成员（按照声明顺序），这样想我觉得还是蛮清楚的，文章分析的蛮好

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。