阅读本文需要5分钟。
目录
2.3,import语句和from...import语句的区别
一,模块化程序设计理念
1,什么是模块?
我们所写的.py结尾的代码文本文件就是模块。
2,什么是包?
包就是一个文件夹,这个文件里装的全是模块文件。类似于钱包,里面装的是钱。不过计算机里的用什么来代替包呢?答案就是文件夹。现实生活中,女生的LV包里面还有各种小包,python中也类似,就是说包支持嵌套,一个文件夹里还会有其他文件夹,那么一个包中还有其他包。
为什么会有包的概念?答案就是方便分类。
3,模块的分类
模块分为标准库模块,第三方模块和用户自定义模块。
4,为什么需要模块化编程
模块(module)对应于Python源代码文件(.py文件)。模块中可以定义变量、函数、类、普通语句。 这样,我们可以将一个Python程序分解成多个模块,便于后期的重复应用。模块化编程(Modular Programming)将一个任务分解成多个模块。每个模块就像一个积木一样,便于后期的反复使用、反复搭建。
模块化编程有如下几个重要优势:1,便于将一个任务分解成多个模块,实现团队协同开发,完成大规模程序;2,实现代码复用,一个模块实现后,可以被反复调用;3 ,可维护性增强。
5,模块化编程的流程
模块化编程的一般流程:1,设计API,进行功能描述。2,编码实现API中描述的功能。3,在模块中编写测试代码,并消除全局代码。4,使用私有函数实现不被外部客户端调用的模块函数。
6,模块的API和功能描述要点
API(Application Programming Interface 应用程序编程接口)是用于描述模块中提供的函数和类的功能描述和使用方式描述。模块化编程中,首先设计的就是模块的API(即要实现的功能描述),然后开始编码实现API中描述的功能。最后,在其他模块中导入本模块进行调用。可以通过help(模块名)查看模块的API。一般使用时先导入模块,然后通过help函数查看。
7,模块的创建和测试代码
每个模块都有一个名称,通过特殊变量 __name__ 可以获取模块的名称。在正常情况下,模块名字对应源文件名。 仅有一个例外,就是当一个模块被作为程序入口时(主程序、交互式提示符下),它的__name__ 的值为 __main__ 。我们可以根据这个特点,将模块源代码文件中的测试代码进行独立的处理。
import os
print(os.__name__)
# os
也就是说模块对象有个隐藏属性__name__,当这个模块作为程序运行时他的值是__main__,当他作为模块被其他模块引用时,他的值是__模块名__。
8,模块文档字符串和API设计
我们可以在模块的第一行增加一个文档字符串,用于描述模块的相关功能。然后,通过 __doc__ 可以获得文档字符串的内容。
上图展示了os模块的模块文档字符串和API设计。
二,模块的导入
1,import导入模块
这种方法会把模块中所有东西导入。常见语法格式如下:
import 模块名 # 导入一个模块
import 模块1,模块2… # 导入多个模块
import 模块名 as 模块别名 # 导入模块并使用新名字
import os # 导入一个模块
import time, pickle # 导入多个模块
import os.path as op # 导入模块并使用新名字
导入之后会在内存里生成一个module对象,并与变量os,time等进行绑定。
2,from … import …
顾名思义,从哪里导入什么。一般可以从模块里导入或者从包里面导入。从模块里一般能导入函数,类等成员;从包里里面能导入子包,模块等成员。
2.1,从模块中导入类,函数,变量等成员
from 模块名 import 成员1,成员2,…
2.2,从模块中导入模块的所有成员
from 模块名 import *
注意,尽量不要使用这种方法,以免命名冲突。
2.3,import语句和from...import语句的区别
import 导入的是模块。 from...import 导入的是模块中的函数/类。如果进行类比的话, import 导入的是“文件”,我们要使用该“文件”下的内容,必须前面加“文件名称”。 from...import 导入的是文件下的“内容”,我们直接使用这些“内容”即可,前面再也不需要加“文件名称”了。
3,模块的加载问题
当导入一个模块时, 模块中的代码都会被执行。不过,如果再次导入这个模块,则不会再次执行。Python的设计者为什么这么设计?因为,导入模块更多的时候需要的是定义模块中的变量、函数、对象等。这些并不需要反复定义和执行。“只导入一次 import-only-once ”就成了一种优化。一个模块无论导入多少次,这个模块在整个解释器进程内有且仅有一个实例对象。
也就是说,重复导入相同的模块,只有第一次会生效。
如果不得不重新加载模块,可以使用importlib.reload() 方法。使用这个方法之前,先导入importlib模块。
4,模块加载时的寻找顺序
查找顺序:
1、在第一次导入某个模块时(比如spam),会先检查该模块是否已经被加载到内存中(当前执行文件的名称空间对应的内存),如果有则直接引用。ps:python解释器在启动时会自动加载一些模块到内存中,可以使用sys.modules查看。
2、如果没有,解释器则会查找同名的内建模块
3、如果还没有找到就从sys.path给出的目录列表中依次寻找spam.py文件。
修改sys.path路径:
import sys
sys.path.append('/a/b/c/d')
sys.path.insert(0, '/x/y/z') # 排在前的目录,优先被搜索
三,包(package)的使用。
3.1 包(package)的概念和结构
当一个项目中有很多个模块时,需要再进行组织。我们将功能类似的模块放到一起,形成了“包”。本质上,“包”就是一个必须有__init__.py 的文件夹。典型结构如下:
包下面可以包含“模块(module)”,也可以再包含“子包(subpackage)”。就像文件夹下面可以有文件,也可以有子文件夹一样。
上图中,a 是上层的包,下面有一个子包:aa 。可以看到每个包里面都有 __init__.py 文件。
3.2 从包中导入子包,模块,子包中的模块,模块的成员
from package import item 这种语法中, item 可以是包、模块,也可以是函数、类、变量。import item1.item2 这种语法中, item 必须是包或模块,不能是其他。
导入包的本质其实是“导入了包的 __init__.py ”文件。也就是说, import pack1 意味着执行了包 pack1 下面的 __init__.py 文件。 这样,可以在__init__.py 中批量导入我们需要的模块,而不再需要一个个导入。
__init__.py 的三个核心作用:1 ,作为包的标识,不能删除。2 ,导入包实质是执行 __init__.py 文件,可以在 __init__.py 文件中做这个包的初始化、以及需要统一执行代码、批量导入。
3.3 用 * 导入包
import * 这样的语句理论上是希望文件系统找出包中所有的子模块,然后导入它们。这可能会花长时间等。Python 解决方案是提供一个明确的包索引。这个索引由 __init__.py 定义 __all__ 变量,该变量为一个列表,如上例 a包下的 __init__.py 中,可定义 __all__ = ["module_A","module_A2"]这意味着, from sound.effects import * 会从对应的包中导入以上两个子模块;尽管提供 import * 的方法,仍不建议在生产代码中使用这种写法。