详解Python字典的底层原理——哈希表(Python面试必备)

最新推荐文章于 2025-03-14 09:29:13 发布

X～～X~~

最新推荐文章于 2025-03-14 09:29:13 发布

阅读量2.9k

点赞数 11

分类专栏： python 文章标签：散列表 python 面试

原文链接：https://blog.csdn.net/qq_42815145/article/details/91353624

版权

python 专栏收录该内容

48 篇文章

订阅专栏

本文详细解析Python字典的底层实现，重点介绍了哈希表的工作机制。字典作为一种无序的键值对容器，其快速查找性能得益于哈希表。哈希表通过键的哈希计算和取余运算确定存储位置。当发生哈希碰撞时，Python采用复杂寻址策略解决。字典的插入、查询和更新操作都依赖于哈希表，且在空间不足时会自动扩容。相较于列表，字典的查找效率更高，尤其在大数据量时表现更优。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

详解Python字典的底层原理——哈希表(Python面试必备)

Python面试经常会被问到：

你能说一说Python字典的底层实现原理吗？
这个问题可以从三个方面来回答：

1.python字典及其特性

字典是Python的一种可变、无序容器数据结构，它的元素以键值对的形式存在，键值唯一，它的特点搜索速度很快：数据量增加10000倍，搜索时间增加不到2倍；当数据量很大的时候，字典的搜索速度要比列表快成百上千倍1。

2.哈希表

Python字典的底层实现是哈希表。什么是哈希表，简单来说就是一张带索引和存储空间的表，对于任意可哈希对象，通过哈希索引的计算公式：hash(hashable)%k（对可哈希对象进行哈希计算，然后对结果进行取余运算），可将该对象映射为0到k-1之间的某个表索引，然后在该索引所对应的空间进行变量的存储/读取等操。

3.Python字典如何运用哈希表
我们通过描述插入，查询，删除，扩容，哈希碰撞这几个过程来解释这一切。

插入：

对键进行哈希和取余运算，得到一个哈希表的索引，如果该索引所对应的表地址空间为空，将键值对存入该地址空间；

更新：

对键进行哈希和取余运算，得到一个哈希表的索引，如果该索引所对应的地址空间中健与要更新的健一致，那么就更新该健所对应的值；

查询：

对要查找的健进行哈希和取余运算，得到一个哈希表的索引，如果该索引所对应的地址空间中健与要查询的健一致，那么就将该键值对取出来；

扩容：

字典初始化的时候，会对应初始化一个有k个空间的表，等空间不够用的时候，系统就会自动扩容，这时候会对已经存在的键值对重新进行哈希取余运算（重新进行插入操作）保存到其它位置；

碰撞：
有时候对于不同的键，经过哈希取余运算之后，得到的索引值一样，这时候怎么办？这时采用公开寻址的方式，运用固定的模式将键值对插入到其它的地址空间，比如线性寻址：如果第i个位置已经被使用，我们就看看第i+1个，第i+2个，第i+3个有没有被使用…直到找到一个空间或者对空间进行扩容。2

比如：我们想存储 {’小小‘：18}这个键值对，经过哈希和取余运算之后，我们发现，其对应的索引值是0，但是0所指向的空间已经被’小王‘占用了，这就是碰撞。怎么办呢？我们看看0+1对应的所以有没有被占用，如果没有，我们就把’小小‘放在索引1所对应的地址空间中。取的时候，也按照同样的规则，进行探查。
在这里插入图片描述
为啥字典比列表查找高效