blog.csdn.net/ffblog/article/details/46558051
一.序列
1.用于存储一系列的数据
2.在内存中,序列就是一块用于存放多个值的连续的内存空间
如a=[10,20,30,40]存储示意:
3.python中序列结构:str,list,tuple,dict,set
4.dict存储原理:底层仍是依靠列表实现,核心是散列表
(1)散列表:
- 散列表是一个稀疏数组(总是有空白元素);包括很多个单元,每个单元叫表元bucket;每个bucket包括两部分:key的引用 & value的引用
- 所有bucket的结构和大小都相同,可以通过偏移量来读取指定的bucket
(2)键值对如何放入dict:
#创建dict对象:
>>>a={}
>>> a['name']='gaoqi'
创建完dict对象后,生成一个散列表,假设长度为8:
首先算出键’name’的散列值,即哈希值:
>>> hash('name')
8232312710671778809
>>> bin(hash('name'))
'-0b1010111101001110110101100100101'
可以用最右侧n(如3)位数(101)2(即(5)10)作为偏移量,查看对应的bucket是否为空:如果为空,放入键值对;否则,取前n位(如3)数(100)2(即(4)10)作为偏移量,如此循环
- 当散列表有2/3的bucket已被使用,将自动扩容
(3)如何根据键查找键值对:
>>>a={'name':'gaoqi'}
>>>a.get('name')
'gaoqi'
调用dict.get(key)时,就是根据key查找键值对,找到value
首先,计算key的散列值
>>>bin(hash('name'))
'-0b1010111101001110110101100100101'
拿出最右边n位(如3)数(101)2作为偏移量,查看对应的bucket是否为空:如果为空,返回none;否则比较key的哈希值是否相同,相同返回value,否则取前n位继续查看,如依次取完仍未找到则返回none
(4)总结:
- key必须可散列
1.num,str,tuple等
2.自定义对象:
·支持hash()
·支持__eq__()
·若a==b为True,则hash(a)==hash(b)也为True
- 内存开销巨大,但查询速度很快,空间换时间
- 往dict添加新键可能导致扩容,使key的次序改变—>不要在遍历dict的同时修改
5.set存储原理:底层是dict实现,set中所有元素都是dict中的key,因此不能重复