Python学习（五）：字典核心底层原理

追梦梓辰

已于 2022-06-23 20:32:30 修改

阅读量315

点赞数

分类专栏： Python 文章标签：哈希算法算法

于 2022-06-23 20:25:48 首次发布

本文链接：https://blog.csdn.net/weixin_63719049/article/details/125434250

版权

Python 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

字典核心底层原理（重要）

字典对象的核心是散列表。散列表是一个稀疏数组(总是有空白元素的数组)，数组的每个单元叫做bucket。

每个bucket有两部分：一个是键对象的引用，一个是值对象的引用
由于，所有bucket结构和大小一致，我们可以通过偏移量来读取指定bucket

将一个键值对放进字典的底层过程:

假设字典a对象创建后，数组长度为8
我们要把‘name’='cs’这个键值对放进字典对象a中，首先第一步需要计算键“name”的散列值。Python中可以通过hash（）来计算
#打印的结果为：0b10011001000000110000011001111011111011111100101100111111011001
print(bin(hash(“name”)))

由于数组长度为8，我们可以拿计算出的散列值的最右边3位数字作为偏移量，即“001”，十进制是数字1，我们查看偏移量1，对应的bucket是否为空。
如果为空，则将键值对放进去。如果不为空，则依次取右边3位作为偏移量，即“011”，十进制是数字3，再查看偏移量为3的bucket是否为空。
直到找到为空的bucket放进去，如果都不为空，那数组就进行扩容，然后偏移量就会发生改变，直到将键值对放进去

数组扩容：如果数组有2/3已经满了，那么数组就会进行扩容，变的更大

根据键查找“键值对”的底层过程：与键值对放进字典的流程类似
注意：因为偏移量最开始是3位3位开始找，我们不确定是不是相同的一个“键值对”，所以我们找到了以后会把找到的“键”拿出来计算散列值，如果散列值相同，则返回
如果不同，说明不是同一个“键值对”，那就继续找，直到找到相同的

用法总结：
1.键必须是可散列的：
（1）数字，字符串，元组都是可散列的
（2）自定义对象需要支持下面三点：①支持hash（）函数 ②支持通过_eq_()方法检测相同性 ③若a == b 为真，则hash（a）== hash(b)也为真
2.字典在内存中开销巨大，典型的空间换时间
3.键查询速度很快
4.往字典里面添加新建肯导致扩容，导致散列表中键的次序变化。因此，不要在遍历字典的同时进行字典的修改