字典核心底层原理(重要)
字典对象的核心是
散列表
。散列表是一个稀疏数组
(总是有空白元素的数组),数组的每个单元
叫做bucket
。每个bucket 有两部分
:一个是键对象的引用
,一个是值对象的引 用
。
由于,所有bucket
结构和大小一致,我们可以通过偏移量来读取
指定 bucket
。
将一个键值对放进字典的底层过程
>>> a = {}
>>>
a["name"]="onepis"
假设字典 a对象创建完后,数组长度为 8:
我们要把”name”=”onepis”
这个键值对
放到字典对象 a
中,首先第一步需要计算 键”name”的散列值
。Python 中可以通过hash()
来计算。
>>> bin(hash("name"))
'-0b1010111101001110110101100100101'
由于数组长度为 8,我们可以拿计算出的散列值的最右边 3 位数字作为
偏移量
,即 “101”,十进制是数字 5。我们查看偏移量 5
,对应的bucket是否为空
。如果为空,则将键值对
放进去。如果不为空
,则依次取右边3位作为偏移量
,即“100”,十进制是数字
4。再查看偏移量为 4 的 bucket 是否为空。直到找到为空的 bucket 将键值对放进去
。
扩容
python会根据散列表的拥挤程度扩容。“扩容”指的是:创造更大的数组,将原有内容 拷贝到新数组中。
接近 2/3 时,数组就会扩容。