Python 字典和集合的的实现:散列表

本文探讨Python字典和集合背后的散列表原理。散列表是一种稀疏数组,利用散列值进行查找。当散列冲突发生时,算法会通过额外取位并重新搜索解决。字典的键必须是可散列的,内存开销大但查询速度快。集合(set)的实现同样基于散列表,存储元素引用。添加新键可能导致字典顺序变化,而集合无序。
摘要由CSDN通过智能技术生成

字典和集合的效率高,和他背后的散列表是绕不开的。

散列表其实是一个稀疏数组(总是有空白元素的数组称为稀疏数组)。散列表的单元叫做表元bucket。在dict的散列表中,每个键值对都占用一个表元,每个表元都有两个部分,一个是对键的引用,一个是对于值的引用。因为表元的大小一致,所以可以通过偏移量来读取表元。python会保证大概有三分之一的表元是空的,快要达到这个阈值的时候,原有的散列表会被复制到一个更大的空间里面。

散列值的相等:

内置的hash()方法是调用对象的__hash__。如果两个对象比较的时候是相等的,那么他的散列值必须相等吗,也就是他们的__hash__相等。

比如如果1 == 1.0 为真,那么hash(1) == hash(1.0) 也要为真。

散列表的算法:

为了获取一个字典的值dict[key],首先python会调用hash(key)来计算key的散列值,把这个值的最后几位数字(具体多少位,要看散列表的大小)当做偏移量&#x

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值