数据结构
字典与集合的数据结构都以散列表的形式进行。
散列表的单元通常叫做表元。表元由两部分组成,一个是对键的引用,一个是对值的引用。每个表元的大小是相同的。所以可以通过偏移量直接计算找到对应表元,从而根据引用找到相应的键以及与之对应的值。
顺序可能会打乱
以散列表实现,那么为了减少冲突,要时刻保持 1/3 的表元为空,典型的空间换时间。
但是在向字典中添加元素时,随时可能扩容,而一旦改变大小,所有字典的散列表都会改变,所以在添加新元素时可能会出现冲突,从而顺序会被打乱。
所以在遍历字典的过程中最好不要添加元素,可能会跳过一些元素。
在 Python 3.x 中的方法.keys(),.values(),.items() 等返回的是字典的视图,会实时反馈字典的变化。而且因为返回的是视图,所以使用key in dict.keys()
时的速度会非常快。(Python 2.x 中返回的是列表)
集合与字典是类似的
命名空间与字典
在程序执行过程中,会先在本地 locals()
微小数组中查询名称,而后到全局变量 globals()
字典中查询,如果依然查不到则会到 __builtin__
对象中查询,实际是在 __builtin__
的 locals()
中查询。
可以在循坏外部定义本地变量,用来保存函数的全局引用,减少查询次数。
一些标准库中的知识点
collections.OrderDict()
会保持添加的字典元素的顺序,使用 popitem(last=False)
取出元素。
collections.Counter()
散列对象的计数器。
from types import MappingProxyType
可以获得只读的字典,此对象无法修改,但修改原字典,proxy字典对象会随之改变。
集合操作
并集 |
,交集 &
,差集 -