SGISTL源码阅读 map与hash_map之间的区别
前言
之前我们已经学习过了这两种关联式容器,他们可以用来存放键值对,并且不可存放重复键值(因为内部调用了insert_unique
),他们所提供的很多插入删除方法也是非常类似的。现在我们来分析一下他们之间的区别。
我们知道map
的底层容器是红黑树,hash_map
的底层是hashtable
,所以他们之间的区别主要是由他们底层的容器来带的,我们主要从时间复杂度和空间复杂度两个方面来说明。
首先我们简要复习一下红黑树和hashtable。
红黑树
map
的底层容器是R-B Tree(红黑树),全称是Red-Black Tree,又称为“红黑树”,它一种特殊的二叉查找树。红黑树的每个节点上都有存储位表示节点的颜色,可以是红(Red)或黑(Black)。
红黑树的特性
- 每个节点都是黑色或者红色
- 根节点必须是黑色
- 每个叶子节点(NIL)是黑色
- 如果一个节点是红色的,那么它的子节点必须是黑色的
- 从一个节点到该节点的子孙节点的所有路径上包含相同数目的黑色节点
hashtable
hashtable
内部维护了一个vector
数组用于存放buckets
,根据键值找到每个实值应该存放的bucket
的位置。每个bucket
中可能不止有一个节点(用于存放实值),因为hashtable
采用了分离链接法来解决键值冲突的问题。
map与hash_map之间的区别
时间复杂度
红黑树的时间复杂度: O(logN)(定理:一棵含有n个节点的红黑树的高度至多为2log(n+1).)
hashtable
的时间复杂度:O(1)
所以hash_map
的查找速度会更快
空间复杂度
hashtable
内部维护的是vector
数组,虽然说时间复杂度达到了O(1),但却是以空间换时间。之前提到过hashtable
采用的是分离链接法解决冲突,会涉及到指针,如果一个桶中的节点数量过多,时间复杂度也会降低,因为链表不支持随机访问,必须一个节点一个节点地遍历,为了避免这样的问题出现,只能通过增加桶子的数量来解决,空间复杂度也会变大。
但是红黑树会自动排序,节点数目和数据的数目是同步的,只要增加一个数据则增加一个红黑树节点,删除一个数据则释放一个红黑树节点。
所以在时间复杂度上,map
是优于hash_map
的。