Python中 -m 的使用和原理

最新推荐文章于 2024-02-14 10:00:18 发布

love1005lin

最新推荐文章于 2024-02-14 10:00:18 发布

阅读量2.5k

点赞数 16

分类专栏： Python使用文章标签： python

本文链接：https://blog.csdn.net/love1005lin/article/details/116298072

版权

Python使用专栏收录该内容

7 篇文章 0 订阅

订阅专栏

Python -m 的使用和原理

在使用命令行Python时，有很多的使用选项：

使用python --help来查看：

usage: python [option] … [-c cmd | -m mod | file | -] [arg] …

本文想要聊聊比较特殊的“-m”选项：关于它的典型用法、原理解析与发展演变的过程。

在这里插入图片描述

-m mod run library module as a script (terminates option list)

"mod"是“module”的缩写，即“-m”选项后面的内容是 module（模块），其作用是把模块当成脚本来运行。

“terminates option list”意味着“-m”之后的其它选项不起作用，在这点上它跟“-c”是一样的，都是“终极选项”。官方把它们定义为“接口选项”（Interface options），需要区别于其它的普通选项或通用选项。

-m 选项的五个典型用法

Python 中有很多使用 -m 选项的场景，相信大家可能会用到或者看见过，我在这里想分享 5 个。

在 Python3 中，只需一行命令就能实现一个简单的 HTTP 服务：

# 端口号只要是空闲的就好
python -m http.server 8000

# 注:在 Python2 中是这样
python -m SimpleHTTPServer 8000

在这里插入图片描述

执行后，在本机打开“http://localhost:8000”，或者在局域网内的其它机器上打开“http://本机ip:8000”，就能访问到执行目录下的内容，例如下图就是我本机的内容：
在这里插入图片描述
与此类似，我们只需要一行命令“python -m pydoc -p xxx”，就能生成 HTML 格式的官方帮助文档，可以在浏览器中访问。

上面的命令执行了 pydoc 模块，会在 12354 端口启动一个 http 服务，在浏览器中打开，我的结果如下：
在这里插入图片描述
它的第三个常见用法是执行 pdb 的调试命令“python -m pdb xxx.py”，以调试模式来执行“xxx.py”脚本：

第四个同样挺有用的场景是用 timeit 在命令行中测试一小段代码的运行时间。以下的 3 段代码，用不同的方式拼接 “0-1-2-……-99” 数字串。可以直观地看出它们的效率差异：
在这里插入图片描述
最后，还有一种常常被人忽略的场景：“python -m pip install xxx”。我们可能会习惯性地使用“pip install xxx”，或者做了版本区分时用“pip3 install xxx”，总之不在前面用“python -m”做指定。但这种写法可能会出问题。

在2019.11.01，Python 的核心开发者、第一届指导委员会五人成员之一的 Brett Cannon 专门写了一篇博客《Why you should use “python -m pip”》，提出应该使用“python -m pip”的方式，并做了详细的解释。

他的主要观点是：在存在多个 Python 版本的环境中，这种写法可以精确地控制三方库的安装位置。例如用“python3.8 -m pip”，可以明确指定给 3.8 版本安装，而不会混淆成其它的版本。

-m 选项的两种原理解析

看了前面的几种典型用法，你是否开始好奇：“-m”是怎么运作的？它是怎么实现的？

对于“python -m name”，一句话解释：Python 会检索sys.path ，查找名字为“name”的模块或者包（含命名空间包），并将其内容当成“main”模块来执行。

1、对于普通模块

以“.py”为后缀的文件就是一个模块，在“-m”之后使用时，只需要使用模块名，不需要写出后缀，但前提是该模块名是有效的，且不能是用 C 语言写成的模块。

在“-m”之后，如果是一个无效的模块名，则会报错“No module named xxx”。

如果是一个带后缀的模块，则首先会导入该模块，然后可能报错：Error while finding module specification for ‘xxx.py’ (AttributeError: module ‘xxx’ has no attribute ‘path’。
在这里插入图片描述
对于一个普通模块，有时候这两种写法表面看起来是等效的：

两种写法都会把定位到的模块脚本当成主程序入口来执行，即在执行时，该脚本的__name__都是”main“，跟 import 导入方式是不同的。

但它的前提是：在执行目录中存在着“py.py”，且只有唯一的“test”模块。对于本例，如果换一个目录执行的话，“python py.py”当然会报找不到文件的错误，然而，“python -m py”却不会报错，因为解释器在遍历sys.path时可以找到同名的“py”模块，并且执行：

在这里插入图片描述
由此差异，我们其实可以总结出“-m”的用法：已知一个模块的名字，但不知道它的文件路径，那么使用“-m”就意味着交给解释器自行查找，若找到，则当成脚本执行。

那么，“-m”方式与直接运行脚本相比，在实现上有什么不同呢？

(1) 直接运行脚本时，相当于给出了脚本的完整路径（不管是绝对路径还是相对路径），解释器根据文件系统的查找机制，定位到该脚本，然后执行。

(2) 使用“-m”方式时，解释器需要在不 import 的情况下，在所有模块命名空间中查找，定位到脚本的路径，然后执行。为了实现这个过程，解释器会借助两个模块：pkgutil 和 runpy，前者用来获取所有的模块列表，后者根据模块名来定位并执行脚本。

2、对于包内模块

如果“-m”之后要执行的是一个包，那么解释器经过前面提到的查找过程，先定位到该包，然后会去执行它的“main”子模块，也就是说，在包目录下需要实现一个“main.py”文件。

换句话说，假设有个包的名称是“pname”，那么，“python -m pname”，其实就等效于“python -m pname.main”。

仍以前文创建 HTTP 服务为例，“http”是 Python 内置的一个包，它没有“main.py”文件，所以使用“-m”方式执行时，就会报错：No module named http.main; ‘http’ is a package and cannot be directly executed。
在这里插入图片描述
作为对比，我们可以看看前文提到的 pip，它也是一个包，为什么“python -m pip”的方式可以使用呢？当然是因为它有“main.py”文件：

在这里插入图片描述
“python -m pip”实际上执行的就是这个“main.py”文件，它主要作为一个调用入口，调用了核心的"pip._internal.main"。

http 包因为没有一个统一的入口模块，所以采用了“python -m 包.模块”的方式，而 pip 包因为有统一的入口模块，所以加了一个“main.py”文件，最后只需要写“python -m 包”，简明直观。

love1005lin

关注

16
点赞
踩
25

收藏

觉得还不错? 一键收藏
8
评论
Python中 -m 的使用和原理

Python -m 的使用和原理在使用命令行Python时，有很多的使用选项：使用python --help来查看：usage: python [option] … [-c cmd | -m mod | file | -] [arg] …本文想要聊聊比较特殊的“-m”选项：关于它的典型用法、原理解析与发展演变的过程。-m mod run library module as a script (terminates option list)"mod"是“module”的缩写，即“-m”
复制链接

扫一扫