第三章(提炼)字典和集合(一)

本文深入探讨Python中的字典和集合,讲解其在程序中的重要性,以及如何利用散列表优化性能。介绍collections.abc中的抽象基类Mapping和MutableMapping,强调可散列对象的关键特性。此外,详细阐述了字典的构造方法、常用映射方法如update,以及setdefault方法在处理找不到键时的优势。
摘要由CSDN通过智能技术生成

        dict 类型不但在各种程序里广泛使用,它也是 Python 语言的基石。模块的命名空间实例的属性函数的关键字参数中都可以看到字典的身影。跟它有关的内置函数都在 __builtins__.__dict__模块中。

        正是因为字典至关重要,Python 对它的实现做了高度优化,而散列表则是字典类型性能出众的根本原因。集合(set)的实现其实也依赖于散列表,因此本章也会讲到它。

一. 范映射类型

        collections.abc 模块中有 Mapping MutableMapping 这两个抽象基类,它们的作用是为 dict 和其他类似的类型定义形式接口collections.abc 中的 MutableMapping 和它的超类的UML 类图(箭头从子类指向超类)如下:

        非抽象映射类型一般不会直接继承这些抽象基类,它们会直接对dict 或是 collections.User.Dict 进行扩展。这些抽象基类的主要 作用是作为形式化的文档,它们定义了构建一个映射类型所需要的最基本的接口。然后它们还可以跟 isinstance 一起被用来判定某个数据是不是广义上的映射类型:

        标准库里的所有映射类型都是利用 dict 来实现的,因此它们有个共同的限制,即只有可散列的数据类型才能用作这些映射里的键。可散列类型的定义:如果一个对象是可散列的,那么在这个对象的生命周期中,它的散列值是不变的,而且这个对象需要实现 __hash__() 方法。如果两个可散列对象是相等的,那么它们的散列值一定是一样的。

        原子不可变数据类型(str、bytes 和数值类型)都是可散列类型,frozenset 也是可散列的,因为根据其定义,frozenset 里 只能容纳可散列类型。元组的话,只有当一个元组包含的所有元素都是可散列类型的情况下,它才是可散列的:

        一般来讲用户自定义的类型的对象都是可散列的,散列值就是它们的 id() 函数的返回值,所以所有这些对象在比较的时候都是不相等的。如果一个对象实现了 __eq__ 方法,并且在方法中用到了这个对象的内部状态的话,那么只有当所有这些内部状态都是不可变的情况下,这个对象才是可散列的。

演示1  字典提供了很多构造方法:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值