提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
一、 模块化(module)程序设计理念
1. 1模块和包概念的进化史
量变引起质变”是哲学中一个重要的理论。量变为什么会引起质变呢?本质上理解,随着数量的增加,管理方式会发生本质的变化;旧的管理方式完全不适合,必须采用新的管理方式。
程序越来越复杂,语句多了,怎么管理?很自然的,我们会将实现同一个功能的语句封装到函数中,统一管理和调用,于是函数诞生了。
程序更加复杂,函数和变量多了,怎么管理?同样的思路,“物以类聚”,我们将同一类型对象的“数据和行为”,也就是“变量和函数”,放到一起统一管理和调用,于是“类和对象”诞生了。
程序继续复杂,函数和类更加多了,怎么办?好,我们将实现类似功能的函数和类统统放到一个模块中,于是“模块”诞生了。
程序还要复杂,模块多了,怎么办? 于是,我们将实现类似功能的模块放到一起,于是“包”就诞生了。
大家可以清晰的看到这发展的流程,核心的哲学思想就是“量变引起质变”、“物以类聚”。
与函数类似,模块也分为标准库模块和用户自定义模块。
Python 标准库提供了操作系统功能、网络通信、文本处理、文件处理、数学运算等基本的功能。比如:random(随机数)、math(数学运算)、time(时间处理)、file(文件处理)、os(和操作系统交互)、sys(和解释器交互)等。
另外,Python 还提供了海量的第三方模块,使用方式和标准库类似。功能覆盖了我们能想象到的所有领域,比如:科学计算、WEB 开发、大数据、人工智能、图形系统等。
模块(module)对应于 Python 源代码文件(.py 文件)。模块中可以定义变量、函数、类、普通语句。 这样,我们可以将一个 Python 程序分解成多个模块,便于后期的重复应用。
1.2 模块化编程的流程
模块化编程的一般流程:
- 设计 API,进行功能描述。
- 编码实现 API 中描述的功能。
- 在模块中编写测试代码,并消除全局代码。
- 使用私有函数实现不被外部客户端调用的模块函数。
API(Application Programming Interface 应用程序编程接口)是用于描述模块中提供的函数和类的功能描述和使用方式描述。
模块化编程中,首先设计的就是模块的 API(即要实现的功能描述),然后开始编码实现 API 中描述的功能。最后,在其他模块中导入本模块进行调用。
我们可以通过help(模块名)查看模块的API。一般使用时先导入模块 然后通过help
每个模块都有一个名称,通过特殊变量__name__可以获取模块的名称。在正常情况下,模块名字对应源文件名。
仅有一个例外,就是当一个模块被作为程序入口时(主程序、交互式提示符下),它的__name__的值为“main”。我们可以根据这个特点,将模块源代码文件中的测试代码进行独立的处理。
我们可以在模块的第一行增加一个文档字符串,用于描述模块的相关功能。然后,通过
__doc__可以获得文档字符串的内容。
二、 模块的导入
模块化设计的好处之一就是“代码复用性高”。写好的模块可以被反复调用,重复使用。
模块的导入就是“在本模块中使用其他模块”。
import 语句的基本语法格式如下:
1.import 模块名 #导入一个模块
2.import 模块 1,模块 2… #导入多个模块
3.import 模块名 as 模块别名 #导入模块并使用新名字
import 加载的模块分为四个通用类别:
a.使用 python 编写的代码(.py 文件);
b.已被编译为共享库或 DLL 的 C 或 C++扩展;
c.包好一组模块的包
d.使用 C 编写并链接到 python 解释器的内置模块;
由上,我们可以看到 math 模块被加载后,实际会生成一个 module 类的对象,该对象被math 变量引用。我们可以通过 math 变量引用模块中所有的内容。 我们通过 import 导入多个模块,本质上也是生成多个 module 类的对象而已。
有时候,我们也需要给模块起个别名,本质上,这个别名仅仅是新创建一个变量引用加载的模块对象而已。
Python 中可以使用 from…import 导入模块中的成员。基本语法格式如下:
from 模块名 import 成员1,成员2
from 模块名 import *
【注】尽量避免from 模块名 import *这种写法。它表示导入模块中所有的不是以下划线(_)开头的名字都导入到当前位置。 但你不知道你导入什么名字,很有可能会覆盖掉你之前已经定义的名字。而且可读性极其的差。一般生产环境中尽量避免使用,学习时没有关系。
比如模块中定义的函数与主程序定义的函数同名,那使用的时候主程序会覆盖原有模块函数
import 导入的是模块。from…import 导入的是模块中的一个函数/一个类。
如果进行类比的话,import 导入的是“文件”,我们要使用该“文件”下的内容,必须前面加“文件名称”。from…import 导入的是文件下的“内容”,我们直接使用这些“内容”即可,前面再也不需要加“文件名称”了。
import 语句本质上就是调用内置函数__import__(),我们可以通过它实现动态导入。给
import()动态传递不同的的参数值,就能导入不同的模块。
注意:一般不建议我们自行使用__import__()导入,其行为在 python2 和 python3 中
有差异,会导致意外错误。如果需要动态导入可以使用 importlib 模块。
当导入一个模块时, 模块中的代码都会被执行。不过,如果再次导入这个模块,则不会再次执行。
Python 的设计者为什么这么设计?因为,导入模块更多的时候需要的是定义模块中 的 变 量 、 函 数 、 对 象 等 。 这 些 并 不 需 要 反 复 定 义 和 执 行 。 “ 只 导 入 一 次import-only-once”就成了一种优化。
三、包的使用
当一个项目中有很多个模块时,需要再进行组织。我们将功能类似的模块放到一起,
形成了“包”。本质上,“包”就是一个必须有__init__.py 的文件夹。典型结构如下:
包下面可以包含“模块(module)”,也可以再包含“子包(subpackage)”。就像文件夹下面可以有文件,也可以有子文件夹一样。
上一节中的包结构,我们需要导入 module_AA.py。方式如下:
- import a.aa.module_AA
在使用时,必须加完整名称来引用,比如:a.aa.module_AA.fun_AA() - from a.aa import module_AA
在使用时,直接可以使用模块名。 比如:module_AA.fun_AA() - from a.aa.module_AA import fun_AA 直接导入函数
在使用时,直接可以使用函数名。 比如:fun_AA()
【注】
4. from package import item 这种语法中,item 可以是包、模块,也可以是函数、
类、变量。
5. import item1.item2 这种语法中,item 必须是包或模块,不能是其他
导入包的本质其实是“导入了包的__init__.py”文件。也就是说,”import pack1”意味着执行了包 pack1 下面的__init__.py 文件。 这样,可以在__init__.py 中批量导入我们需要的模块,而不再需要一个个导入。
init.py 的三个核心作用:
1.作为包的标识,不能删除。
2 .用来实现模糊导入
3.导入包实质是执行__init__.py 文件,可以在__init__.py 文件中做这个包的初始化、以及需要统一执行代码、批量导入。
【注】如上测试我们可以看出 python 的设计者非常巧妙的通过__init__.py 文件将包转成了模块的操作。因此,可以说“包的本质还是模块”.
【注】尽管提供 import * 的方法,仍不建议在生产代码中使用这种写法。
如果是子包内的引用,可以按相对位置引入子模块 以 aa 包下的 module_AA 中导入 a
包下内容为例:
from … import module_A # …表示上级目录 .表示同级目录
from . import module_A2
四、 sys.path 和模块搜索路径
当我们导入某个模块文件时, Python 解释器去哪里找这个文件呢?只有找到这个文件才能读取、装载运行该模块文件。它一般按照如下路径寻找模块文件(按照顺序寻找,找到即停不继续往下寻找):
- 内置模块
- 当前目录
- 程序的主目录
- pythonpath 目录(如果已经设置了 pythonpath 环境变量)
- 标准链接库目录
- 第三方库目录(site-packages 目录)
- .pth 文件的内容(如果存在的话)
- sys.path.append()临时添加的目录
五. 模块发布和安装