字典和集合的效率高,和他背后的散列表是绕不开的。
散列表其实是一个稀疏数组(总是有空白元素的数组称为稀疏数组)。散列表的单元叫做表元bucket。在dict的散列表中,每个键值对都占用一个表元,每个表元都有两个部分,一个是对键的引用,一个是对于值的引用。因为表元的大小一致,所以可以通过偏移量来读取表元。python会保证大概有三分之一的表元是空的,快要达到这个阈值的时候,原有的散列表会被复制到一个更大的空间里面。
散列值的相等:
内置的hash()方法是调用对象的__hash__。如果两个对象比较的时候是相等的,那么他的散列值必须相等吗,也就是他们的__hash__相等。
比如如果1 == 1.0 为真,那么hash(1) == hash(1.0) 也要为真。
散列表的算法:
为了获取一个字典的值dict[key],首先python会调用hash(key)来计算key的散列值,把这个值的最后几位数字(具体多少位,要看散列表的大小)当做偏移量&#x