Python学习(五):字典核心底层原理

字典核心底层原理(重要)

字典对象的核心是散列表。散列表是一个稀疏数组(总是有空白元素的数组),数组的每个单元叫做bucket。

每个bucket有两部分:一个是键对象的引用,一个是值对象的引用
由于,所有bucket结构和大小一致,我们可以通过偏移量来读取指定bucket

将一个键值对放进字典的底层过程:

假设字典a对象创建后,数组长度为8
我们要把‘name’='cs’这个键值对放进字典对象a中,首先第一步需要计算键“name”的散列值。Python中可以通过hash()来计算
#打印的结果为:0b10011001000000110000011001111011111011111100101100111111011001
print(bin(hash(“name”)))


由于数组长度为8,我们可以拿计算出的散列值的最右边3位数字作为偏移量,即“001”,十进制是数字1,我们查看偏移量1,对应的bucket是否为空。
如果为空,则将键值对放进去。如果不为空,则依次取右边3位作为偏移量,即“011”,十进制是数字3,再查看偏移量为3的bucket是否为空。
直到找到为空的bucket放进去,如果都不为空,那数组就进行扩容,然后偏移量就会发生改变,直到将键值对放进去


数组扩容:如果数组有2/3已经满了,那么数组就会进行扩容,变的更大


根据键查找“键值对”的底层过程:与键值对放进字典的流程类似
注意:因为偏移量最开始是3位3位开始找,我们不确定是不是相同的一个“键值对”,所以我们找到了以后会把找到的“键”拿出来计算散列值,如果散列值相同,则返回
如果不同,说明不是同一个“键值对”,那就继续找,直到找到相同的


用法总结:
1.键必须是可散列的:
(1)数字,字符串,元组都是可散列的
(2)自定义对象需要支持下面三点:①支持hash()函数 ②支持通过_eq_()方法检测相同性 ③若a == b 为真,则hash(a)== hash(b)也为真
2.字典在内存中开销巨大,典型的空间换时间
3.键查询速度很快
4.往字典里面添加新建肯导致扩容,导致散列表中键的次序变化。因此,不要在遍历字典的同时进行字典的修改

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值