Python(11)模块(module)、包(package)

最新推荐文章于 2022-10-10 22:00:00 发布

yyuan_in

最新推荐文章于 2022-10-10 22:00:00 发布

阅读量836

点赞数

分类专栏： Python基础知识文章标签： python

本文链接：https://blog.csdn.net/yyuan_in/article/details/115541120

版权

Python基础知识专栏收录该内容

10 篇文章 0 订阅

订阅专栏

文章目录

模块化(module)程序设计理念
模块的导入
包 package 的使用
模块发布和安装

模块化(module)程序设计理念

模块和包概念的进化史

“量变引起质变”是哲学中一个重要的理论。量变为什么会引起质变呢？本质上理解，随着数量的增加，管理方式会发生本质的变化；旧的管理方式完全不适合，必须采用新的管理方式。程序越来越复杂，语句多了，怎么管理？很自然的，我们会将实现同一个功能的语句封装到函数中，统一管理和调用，于是函数诞生了。程序更加复杂，函数和变量多了，怎么管理？同样的思路，“物以类聚”，我们将同一类型对象的“数据和行为”，也就是“变量和函数”，放到一起统一管理和调用，于是“类和对象”诞生了。程序继续复杂，函数和类更加多了，怎么办？好，我们将实现类似功能的函数和类统统放到一个模块中，于是“模块”诞生了。程序还要复杂，模块多了，怎么办？于是，我们将实现类似功能的模块放到一起，于是“包”就诞生了。大家可以清晰的看到这发展的流程，核心的哲学思想就是“量变引起质变”、“物以类聚”。同样的思路，在企业管理、人的管理中思路完全一致。大家可以举一反三。

在这里插入图片描述

Python 程序由模块组成。一个模块对应 python 源文件，一般后缀名是：.py。
模块由语句组成。运行 Python 程序时，按照模块中语句的顺序依次执行。
语句是 Python 程序的构造单元，用于创建对象、变量赋值、调用函数、控制语句等。

标准库模块(standard library)

与函数类似，模块也分为标准库模块和用户自定义模块。 Python 标准库提供了操作系统功能、网络通信、文本处理、文件处理、数学运算等基本的功能。比如：random(随机数)、math(数学运算)、time(时间处理)、file(文件处理)、 os(和操作系统交互)、sys(和解释器交互)等。另外，Python 还提供了海量的第三方模块，使用方式和标准库类似。功能覆盖了我们能想象到的所有领域，比如：科学计算、WEB 开发、大数据、人工智能、图形系统等。

为什么需要模块化编程

模块(module)对应于 Python 源代码文件(.py 文件)。模块中可以定义变量、函数、类、普通语句。这样，我们可以将一个 Python 程序分解成多个模块，便于后期的重复应用。模块化编程（Modular Programming）将一个任务分解成多个模块。每个模块就像一个积木一样，便于后期的反复使用、反复搭建。
模块化编程有如下几个重要优势：

便于将一个任务分解成多个模块，实现团队协同开发，完成大规模程序
实现代码复用。一个模块实现后，可以被反复调用。
可维护性增强。

模块化编程的流程

模块化编程的一般流程：

设计 API，进行功能描述。
编码实现 API 中描述的功能。
在模块中编写测试代码，并消除全局代码
使用私有函数实现不被外部客户端调用的模块函数。

模块的 API 和功能描述要点

API(Application Programming Interface 应用程序编程接口)是用于描述模块中提供的函数和类的功能描述和使用方式描述。模块化编程中，首先设计的就是模块的 API（即要实现的功能描述），然后开始编码实现 API 中描述的功能。最后，在其他模块中导入本模块进行调用。我们可以通过help(模块名)查看模块的API。一般使用时先导入模块然后通过help函数查看。
导入 math 模块，并通过 help()查看 math 模块的 API：`

import math 
help(math)

也可以在 python 的 api 文档中查询。首先进入 python 的安装目录下的 docs 子目录：
在这里插入图片描述
双击打开 chm 文档，即可通过索引输入“math”查询到对应的 API 内容。
设计计算薪水模块的 API：

"""
    用于计算公司员工的薪资
"""

company = "aaa"

def yearSalary(monthSalary):
    #计算年薪
    """根据传入的月薪的值，计算出年薪：monthsalary*12"""
    return monthSalary*12


def daySalary(monthSalary):
    """根据传入的月薪值，计算出1天的薪资。一个月按照22.5天计算（国家规定的工作日）"""
    return monthSalary/22.5



if __name__ == "__main__": #测试代码。可以有好的单元测试的效果，当其他模块调用时，这部分代码不会被运行
    print(yearSalary(5000))

如上模块只有功能描述和规范，需要编码人员按照要求实现编码。我们可以通过__doc__可以获得模块的文档字符串的内容：

import Salary

print(Salary.__doc__)
print(Salary.daySalary.__doc__)
print(Salary.__name__)
'''result:
    用于计算公司员工的薪资

根据传入的月薪值，计算出1天的薪资。一个月按照22.5天计算（国家规定的工作日）
Salary
'''

模块的创建和测试代码

每个模块都有一个名称，通过特殊变量__name__可以获取模块的名称。在正常情况下，模块名字对应源文件名（从其他模程序中导入该模块时）。仅有一个例外，就是当一个模块被作为程序入口时（主程序、交互式提示符下）（在本模块中运行本模块时），它的__name__的值为“main”。我们可以根据这个特点，将模块源代码文件中的测试代码进行独立的处理。

import math ‘
math.__name__ 
'''result:
math
'''

"""
    用于计算公司员工的薪资
"""

company = "aaa“

def yearSalary(monthSalary):
    #计算年薪
    """根据传入的月薪的值，计算出年薪：monthsalary*12"""
    return monthSalary*12


def daySalary(monthSalary):
    """根据传入的月薪值，计算出1天的薪资。一个月按照22.5天计算（国家规定的工作日）"""
    return monthSalary/22.5


if __name__ == "__main__": #测试代码。直接运行本模块时会执行这部分代码，当其他模块调用此模块时，这部分代码不会被运行
    print(yearSalary(5000))

模块文档字符串和 API 设计

我们可以在模块的第一行增加一个文档字符串，用于描述模块的相关功能。然后，通过 __doc__可以获得文档字符串的内容。
模块文档字符串示例以及导入后如何读取文档字符串：

import Salary


print(Salary.__doc__)
print(Salary.daySalary.__doc__)
print(Salary.__name__)
'''result:
    用于计算公司员工的薪资

根据传入的月薪值，计算出1天的薪资。一个月按照22.5天计算（国家规定的工作日）
Salary
'''

模块的导入

模块化设计的好处之一就是“代码复用性高”。写好的模块可以被反复调用，重复使用。模块的导入就是“在本模块中使用其他模块”。

import 语句导入

import 语句的基本语法格式如下：
import 模块名 #导入一个模块
import 模块 1，模块 2… #导入多个模块
import 模块名 as 模块别名 #导入模块并使用新名字

import 加载的模块分为四个通用类别：
a.使用 python 编写的代码（.py 文件）；
b.已被编译为共享库或 DLL 的 C 或 C++扩展；
c.包好一组模块的包；
d.使用 C 编写并链接到 python 解释器的内置模块；

我们一般通过 import 语句实现模块的导入和使用，import 本质上是使用了内置函数 import()。当我们通过 import 导入一个模块时，python 解释器进行执行，最终会生成一个对象，这个对象就代表了被加载的模块。（e.g.第一次import math,查询print(id(math))的结果和后面任何一次import math时的print(id(math))结果一样）

import math
print(id(math),type(math))

import math
print('#####')
print(id(math),type(math))

'''result;
2734801238920 <class 'module'>
#####
2734801238920 <class 'module'>

由上，我们可以看到 math 模块被加载后，实际会生成一个 module 类的对象，该对象被 math 变量引用。我们可以通过 math 变量引用模块中所有的内容。我们通过 import 导入多个模块，本质上也是生成多个 module 类的对象而已。有时候，我们也需要给模块起个别名，本质上，这个别名仅仅是新创建一个变量引用加载的模块对象而已。

import math as m #相当于m=math
print('#####')
print(id(math),type(math))
'''result:
#####
2003450215384 <class 'module'>
'''

from…import 导入

Python 中可以使用 from…import 导入模块中的成员。基本语法格式如下：
from 模块名 import 成员 1，成员 2，…
如果希望导入一个模块中的所有成员，则可以采用如下方式：
from 模块名 import *

注意尽量避免“from 模块名 import ”这种写法。“”表示导入模块中所有的不是以下划线(_)开头的名字都导入到当前位置。但你不知道你导入什么名字，很有可能会覆盖掉你之前已经定义的名字。而且可读性极其的差。一般生产环境中尽量避免使用，学习时没有关系。

import math
print(math.sin(85))

from math import sin
print(sin(85))
'''result:
-0.1760756199485871
-0.1760756199485871
'''

import 语句和 from…import 语句的区别

import 导入的是模块。from…import 导入的是模块中的一个函数/一个类。如果进行类比的话，import 导入的是“文件”，我们要使用该“文件”下的内容，必须前面加“文件名称”。from…import 导入的是文件下的“内容”，我们直接使用这些“内容”即可，前面再也不需要加“文件名称”了。

import()动态导入和importlib 模块

import 语句本质上就是调用内置函数__import__()，我们可以通过它实现动态导入。给 import()动态传递不同的的参数值，就能导入不同的模块。

a='math'
b='turtle'

m=__import__(a)
print(m.sin(85))
print(m.pi)

t=__import__(b)
t.penup()
'''result:
-0.1760756199485871
3.141592653589793
'''

注意：一般不建议我们自行使用__import__()导入，其行为在 python2 和 python3 中有差异，会导致意外错误。如果需要动态导入可以使用 importlib 模块。

import importlib

a='math'
b='turtle'
c=importlib.import_module(a)
print(c.sin(85))
print(c.pi)

d=importlib.import_module('os')
print(d.name)
'''result:
-0.1760756199485871
3.141592653589793
nt
'''

模块的加载问题

当导入一个模块时，模块中的代码都会被执行。不过，如果再次导入这个模块，则不会再次执行。 Python 的设计者为什么这么设计？因为，导入模块更多的时候需要的是定义模块中的变量、函数、对象等。这些并不需要反复定义和执行。 “ 只导入一次 import-only-once”就成了一种优化。一个模块无论导入多少次，这个模块在整个解释器进程内有且仅有一个实例对象。
test02.py 的源代码：
print(“test02 模块被加载了…”)

test03.py 的源代码：

import test02 #会执行 test02 模块中的语句 
import test02 #不会再执行 test02 模块中的语句

重新加载：
有时候我们确实需要重新加载一个模块，这时候可以使用：importlib.reload() 方法：

import test02 #执行 test02 模块中的语句 
import test02 #不执行 test02 模块中的语句 
print("####") 
import importlib 
importlib.reload(test02)#执行 test02 模块中的语句 
'''result:
test02 模块被加载了...
####
test02 模块被加载了...
'''

包 package 的使用

本节例子中的结构为：
在这里插入图片描述

包(package)的概念和结构

当一个项目中有很多个模块时，需要再进行组织。我们将功能类似的模块放到一起，形成了“包”。本质上，“包”就是一个必须有__init__.py 的文件夹。典型结构如下：
在这里插入图片描述
包下面可以包含“模块(module)”，也可以再包含“子包(subpackage)”。就像文件夹下面可以有文件，也可以有子文件夹一样。

在这里插入图片描述
上图中，a 是上层的包，下面有一个子包：aa。可以看到每个包里面都有__init__.py 文件。

pycharm 中创建包

在 pycharm 开发环境中创建包，非常简单。在要创建包的地方单击右键：New–>Python package 即可。pycharm 会自动帮助我们生成带有__init__.py 文件的包。

导入包操作和本质

上一节中的包结构，我们需要导入 module_AA.py。方式如下：

import a.aa.module_AA ,在使用时，必须加完整名称来引用，比如：a.aa.module_AA.fun_AA()
from a.aa import module_AA ,在使用时，直接可以使用模块名。比如：module_AA.fun_AA()
from a.aa.module_AA import fun_AA 直接导入函数在使用时，直接可以使用函数名。比如：fun_AA()

【注意】
4. from package import item 这种语法中，item 可以是包、模块，也可以是函数、类、变量。
5. import item1.item2 这种语法中，item 必须是包或模块，不能是其他。

**导入包的本质其实是“导入了包的__init__.py”文件。**也就是说，”import pack1”意味着执行了包 pack1 下面的__init__.py 文件。这样，可以在__init__.py 中批量导入我们需要的模块，而不再需要一个个导入。 init.py 的三个核心作用：

作为包的标识，不能删除。
用来实现模糊导入
导入包实质是执行__init__.py 文件，可以在__init__.py 文件中做这个包的初始化、以及需要统一执行代码、批量导入。

a 包下的__init__.py 文件内容：

 import turtle 
 import math 
 print("导入 a 包")

b 包下的 module_B1.py 文件中导入 a 包，代码如下：

import a 
print(a.math.pi)

执行结果如下：
导入 a 包
3.141592653589793

【注】如上测试我们可以看出 python 的设计者非常巧妙的通过__init__.py 文件将包转成了模块的操作。因此，可以说“包的本质还是模块”。

用*导入包(模糊导入)

import * 这样的语句理论上是希望文件系统找出包中所有的子模块，然后导入它们。这可能会花长时间等。Python解决方案是提供一个明确的包索引。这个索引由 init.py 定义 all 变量，该变量为一列表，如上例 a 包下的 init.py 中，可定义 all = [“module_A”,“module_A2”] 这意味着， from sound.effects import * 会从对应的包中导入以上两个子模块；【注】尽管提供 import * 的方法，仍不建议在生产代码中使用这种写法。

包内引用

如果是子包内的引用，可以按相对位置引入子模块。
from … import module_A #…表示上级目录 .表示同级目录
from . import module_A2 #.表示同级目录

sys.path 和模块搜索路径

当我们导入某个模块文件时， Python 解释器去哪里找这个文件呢？只有找到这个文件才能读取、装载运行该模块文件。它一般按照如下路径寻找模块文件（按照顺序寻找，找到即停不继续往下寻找）：

内置模块
当前目录
程序的主目录
pythonpath 目录（如果已经设置了 pythonpath 环境变量）
标准链接库目录
第三方库目录（site-packages 目录）
.pth 文件的内容（如果存在的话）
sys.path.append()临时添加的目录

当任何一个 python 程序启动时，就将上面这些搜索路径(除内置模块以外的路径)进行收集，放到 sys 模块的 path 属性中（sys.path）。

使用 sys.path 查看和临时修改搜索路径:

我们在项目的 b 目录下建立测试模块：
import sys
sys.path.append(“d:/”)
print(sys.path)
执行结果：
在这里插入图片描述

pythonpath 环境变量的设置

windows 系统中通过如下操作添加和设置 pythonpath 环境变量。
在这里插入图片描述

.pth 文件的写法

我们可以在 site-packages 目录下添加.pth 文件。并在文件中增加内容：
#一行一个目录
g:\a
g:\b
g:\c

【注】1. 需确保 g:\a,g:\b,g:\c 对应的目录真实存在。 2. 在 windows 系统中建立.pth 文件，由于没有文件名不能直接建立。需要输入：“.pth.”才能正常建立.pth 文件。

模块发布和安装

模块的本地发布

当我们完成了某个模块开发后，可以将他对外发布，其他开发者也可以以“第三方扩展库”的方式使用我们的模块。我们按照如下步骤即可实现模块的发布： 1.为模块文件创建如下结构的文件夹（一般，文件夹的名字和模块的名字一样）：
在这里插入图片描述
2.在文件夹中创建一个名为『setup.py』的文件，内容如下：

from distutils.core import setup

setup(
    name='testmath',# 对外我们模块的名字
    version='1.0', # 版本号
    description='这是第一个对外发布的模块，测试',#描述
    author='yuan',# 作者
    author_email='123@163.com',
    py_modules=['testmath.demo1','testmath.demo2'] # 要发布的模块

)

构建一个发布文件。通过终端cmd，cd 到模块文件夹 c 下面（或者直接选中math3右键点击open in terminal）再键入命令：python setup.py sdist
执行完毕后，目录结构变为：

本地安装模块

将模块发布安装到你的本地计算机上：仍在 cmd 命令行模式下操作，进 setup.py 所在目录（或者直接选中math3右键点击open in terminal），键入命令：
python setup.py install
安装成功后，我们进入 python 目录/Lib/site-packages 目录（我的是D:\anaconda3\Lib\site-packages\testmath）（第三方模块都安装在这里,python 解释器执行时也会搜索这个路径）。
安装成功后，直接使用 import 导入即可：
import testmath.demo1

上传模块到 PyPI

将自己开发好的模块上传到 PyPI 网站上，将成为公开的资源，可以让全球用户自由使用。按照如下步骤做，很容易就实现上传模块操作。

注册 PyPI 网站

http://pypi.python.org
在这里插入图片描述

创建用户信息文件.pypirc

·方式 1：使用命令(适用 Linux)
输入并执行 python setup.py register ，然后输入用户名和密码，即可。
·方式 2：使用文件(适用 windows,Linux)
在用户的家目录里创建一个文件名为.pypirc, 内容为：
[distutils]
index-servers=pypi

[pypi]
repository = https://upload.pypi.org/legacy/
username =pypi 账户名
password = pypi的密码

【注】
Linux 的家目录： ~/.pypirc
Windows 的家目录是： c:/user/用户名
在 windows 下直接创建不包含文件名的文件会失败，因此创建时文件名为“.pypirc.”，前后都有两个点即可。