python中list, tuple, dictionary, set的底层细节

1.列表实现是基于数组或基于链表结构的。
2.列表和元组的区别是显然的:
列表是动态的,其大小可以该标 (重新分配),
而元组是不可变的,一旦创建就不能修改。
3.字典
a.CPython使用伪随机探测(pseudo-random probing)的散列表(hash table)(哈希表)作为字典的底层数据结构。由于这个实现细节,只有可哈希的对象才能作为字典的键。Python中所有不可变的内置类型都是可哈希的。可变类型(如列表,字典和集合)就是不可哈希的,因此不能作为字典的键。
注:普通的set无法作为dict的键,必须选择被“冻结”的不可变集合类:frozenset。顾名思义,一旦初始化,集合内数据不可修改。
b.建立哈希表的具体过程如下:
1)数据添加:把key通过哈希函数转换成一个整型数字,然后就将该数字对数组长度进行取余,取余结果就当作数组的下标,将value存储在以该数字为下标的数组空间里。
2)数据查询:再次使用哈希函数将key转换为对应的数组下标,并定位到数组的位置获取value。
c.本质上看哈希函数不可能做成一个一对一的映射关系,其本质是一个多对一的映射,这也就引出了下面一个概念–哈希冲突或者说哈希碰撞。哈希碰撞是不可避免的,但是一个好的哈希函数的设计需要尽量避免哈希碰撞。
4.集合
a.集合何时使用:当元素顺序的重要性不如元素的唯一性和测试元素是否包含在集合中时使用。
b.set集合和dict一样也是基于散列表的,只是他的表元只包含值的引用而没有对键的引用,其他的和dict基本上是一致的
c.set的去重是通过两个函数__hash__和__eq__结合实现的。
1)当两个变量的哈希值不相同时,就认为这两个变量是不同的
2)当两个变量哈希值一样时,调用__eq__方法,当返回值为True时认为这两个变量是同一个,应该去除一个。返回FALSE时,不去重
5.list有以下几个特点:
a.元素有位置下标,以索引就可以直接取到元素 --> 连续的存储空间,以偏移量计算取得元素,不必遍历所有元素
b.元素无论如何改变,表对象不变,也就是其id不变 --> 分离式结构,表头和元素内容分开储存,这样在更改list时,表对象始终是同一个,只是其指向的地址不同
c.元素可以是任意类型 --> 既要要求是连续存储,又可以存储不同类型的数据,那么其用的就是元素外置的方式,存储的只是地址的引用
d.可以任意添加新元素 --> 要能不断地添加新元素,其使用了动态扩充的策略
6. 列表的底层实现
a.CPython 如何实现列表初始化:
先分配一个对象的内存块,同时将这个内存块的大小置零。再给这个对象分配一个内存槽的大小。分配的槽的大小,会比元素个数大一点,目的就是为了防止在每次添加元素的时候都去调用分配内存的函数。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值