Python_数据结构_字典和集合的差异对比

一.字典和集合基础

  • 字典是一系列由键(key)和值(value)配对组成的元素的集合
  • 在 Python3.7+,字典被确定为有序(注意:在 3.6 中,字典有序是一个 implementation detail,在 3.7 才正式成为语言特性,因此 3.6 中无法 100% 确保其有序性),而 3.6 之前是无序的
  • 其长度大小可变,元素可以任意地删减和改变。
  • 相比于列表和元组,字典的性能更优,特别是对于查找、添加和删除操作,字典都能在常数时间复杂度内完成。
  • 而集合和字典基本相同,唯一的区别,就是集合没有键和值的配对,是一系列无序的、唯一的元素组合。

二.字典和集合的相同点

  • 字典和集合的键和值都可以为混合类型
  • 想要判断一个元素在不在字典或集合内,可以用 value in dict/set 来判断。
  • 除了创建和访问,字典和集合也同样支持增加、删除、更新等操作。

三.字典和集合的不同点

  • 字典访问可以直接索引键,如果不存在,就会抛出异常。也可以使用 get(key, default) 函数来进行索引。如果键不存在,调用 get() 函数可以返回一个默认值
  • 集合并不支持索引操作,因为集合本质上是一个哈希表,和列表不一样。
d = {'b': 1, 'a': 2, 'c': 10}
# 将字典按照键排序
d_sorted_by_key = sorted(d.items(), key=lambda x:x[0])
# 将字典按照值排序
d_sorted_by_value = sorted(d.items(), key=lambda x:x[1])
print(d_sorted_by_key)      # [('a', 2), ('b', 1), ('c', 10)]
print(d_sorted_by_value)    # [('b', 1), ('a', 2), ('c', 10)]

s = {1, 4, 6, 2}
# 对集合进行排序
print(sorted(s))            # [1, 2, 4, 6]

四.字典和集合的性能对比

字典和集合是进行过性能高度优化的数据结构,特别是对于查找、添加和删除操作

五.字典和集合的工作原理

不同于其他数据结构,字典和集合的内部结构都是一张哈希表。

  • 对于字典而言,这张表存储了哈希值(hash)、键和值这 3 个元素。
  • 而对集合来说,区别就是哈希表内没有键和值的配对,只有单一的元素了。

插入操作

每次向字典或集合插入一个元素时,Python 会首先计算键的哈希值(hash(key)),再和 mask = PyDicMinSize - 1 做与操作,计算这个元素应该插入哈希表的位置 index = hash(key) & mask。如果哈希表中此位置是空的,那么这个元素就会被插入其中。而如果此位置已被占用,Python 便会比较两个元素的哈希值和键是否相等。若两者都相等,则表明这个元素已经存在,如果值不同,则更新值。若两者中有一个不相等,这种情况我们通常称为哈希冲突(hash collision),意思是两个元素的键不相等,但是哈希值相等。这种情况下,Python 便会继续寻找表中空余的位置,直到找到位置为止。值得一提的是,通常来说,遇到这种情况,最简单的方式是线性寻找,即从这个位置开始,挨个往后寻找空位。

查找操作

和前面的插入操作类似,Python 会根据哈希值,找到其应该处于的位置;然后,比较哈希表这个位置中元素的哈希值和键,与需要查找的元素是否相等。如果相等,则直接返回;如果不等,则继续查找,直到找到空位或者抛出异常为止。

删除操作

对于删除操作,Python 会暂时对这个位置的元素,赋于一个特殊的值,等到重新调整哈希表的大小时,再将其删除。

哈希冲突

哈希冲突的发生,往往会降低字典和集合操作的速度。因此,为了保证其高效性,字典和集合内的哈希表,通常会保证其至少留有 1/3 的剩余空间。随着元素的不停插入,当剩余空间小于 1/3 时,Python 会重新获取更大的内存空间,扩充哈希表。不过,这种情况下,表内所有的元素位置都会被重新排放。虽然哈希冲突和哈希表大小的调整,都会导致速度减缓,但是这种情况发生的次数极少。所以,平均情况下,这仍能保证插入、查找和删除的时间复杂度为 O(1)。

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
字典集合Python中都是一种数据结构,但它们有一些区别。 首先,字典是由键(key)和值(value)配对组成的元素的集合,而集合是一系列无序的、唯一的元素组合。字典可以通过键来访问对应的值,如果键不存在,则会抛出异常;而集合不支持索引操作,只能通过值来判断元素是否存在。 其次,字典集合的性能表现也有所不同。字典的查找、添加和删除操作都可以在常数时间复杂度内完成,而集合的性能也非常高效。因此,在需要高效地进行查找和去重操作时,字典集合都是很好的选择。 此外,字典集合的内部结构都是一张哈希表,但字典存储了键、值和哈希值这三个元素,而集合内只存储了哈希值。这也是导致字典可以通过键来索引值,而集合不支持索引操作的原因。 综上所述,字典集合区别在于字典是键值对的集合,支持通过键来访问值,而集合是无序的、唯一的元素组合,不支持索引操作。同时,字典集合在性能上都表现出色,适用于不同的场景。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [Python_数据结构_字典集合差异对比](https://blog.csdn.net/feizuiku0116/article/details/119777675)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [Python中的字典集合有什么区别?](https://blog.csdn.net/2301_78316786/article/details/131133549)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值