https://m.toutiao.com/is/JtXTSjN/
使用python一段时间,如果问下面这些问题你能明确回答吗?包与模块是什么?
__init__.py、__main__.py是做什么用的?import语句背后做了什么?
python程序是怎么加载的?
都说python是脚本语言,那脚本程序如何运行?
python -m 运行程序,有没有-m有什么区别?
__name__准确含义?
如果有疑问,那就跟随笔者,通过实验来搞明白这些。
*在开始前,先明确两个概念:包、模块:
模块,等同于一个.py文件(不包括扩展名)。
包,是一个目录,此目录中的.py文件是相互关联,一般此目录中常会有__init__.py和__main__.py文件。
*本环境使用的python版本为3.6.5,运行代码都是在D:\workpython\zaglib目录下
*运行环境为启动当前venv下虚拟环境
一、python程序如何运行
python程序运行流程
上图是python程序的运行流程:
源代码.py被编译成字节码(内存中PyCodeObject),然后由PVM虚拟机运行;
生成的字节码,会被保存到当前目录下的__pycache__中,命名为*.pyc(需要满足条件);
下次再执行时,会检查当前源文件与对应pyc文件时间,如果源文件被修改过,则重新生成pyc,否则直接加载字节码运行。
'''run1.py、run2.py、package1/__main__.py三个文件都是此代码'''import sysprint(__file__) #当前文件名print(__name__) #当前命名空间引用名 #sys.path为搜索模块的路径列表paths=sorted(sys.path) for p in paths: print(p)'''import_run1.py'''import run1print(__name__)
运行python run1.py,当面目录下没有生成__pycache__目录。
运行python import_run1.py 当面目录下生成__pycache__目录,其中生成文件run1.cpython-36.pyc(36表示python为3.6版本),此即为保存的字节码文件。
import_run1.py中只有一行代码: import run1。这就是要满足的条件,run1被import,run1.py被当做公共模块,才保存其字节码文件。
二、python -m的作用
run1.py、run2.py、package1/__main__.py三个文件代码相同(参考上文)
'''run3.py'''import sysprint(__file__)print(__name__)if __name__=='__main__': paths=sorted(sys.path) for p in paths: print(p)'''__init__.py'''print(__file__)print(__name__)
a、python -m 模块名
是在python模块搜索路径(sys.path)中查找指定模块,并作为脚本程序执行。代码执行的作用域名字__name__为__main__。
实验:在zaglib/下,运行run1.py
python -m run1
输出第一行:D:\workpython\zaglib\run1.py 为print(__file__)的输出(绝对路径)
第二行为:__main__ 为print(__name__)输出
sys.path搜索路径第一行为空行,即为当前路径。
python run1.py
运行结果第一行:run1.py,为print(__file__)的输出(相对路径)
第二行为:__main__ 为print(__name__)输出
结论:运行当前位置下py文件,有无-m,效果基本一致。
实验:在zaglib/下,运行zaglib/venv/run2.py
python -m run2
输出第一行:D:\workpython\zaglib\venv\run2.py 为print(__file__)的输出(绝对路径)
第二行为:__main__ 为print(__name__)输出,使用-m时,能成功找到并运行。
python run2找不到文件
结论:运行在其他位置的模块,-m可以在sys.path中搜索。如果没有-m,则不会查找。
b、python -m 包名
会运行 包名.__main__.py。
python -m package1
输出第一行:D:\workpython\zaglib\package1\__init__.py 为print(__file__)的输出(绝对路径);
第二行为:package1 为__init__.py中print(__name__)输出;
输出第三行:D:\workpython\zaglib\package1\__main__.py 为print(__file__)的输出(绝对路径);
第四行为:__main__ 为__main__.py中print(__name__)输出;
从输出看出,python -m package1,先运行了package1/__init__.py,再运行了__main__.py;
而__init__.py中__name__则对应包名package1,__main__.py 的命名空间称为__main__。
python -m package1.__main__输出与上图相同
结论:除非程序在当前位置运行,否则一律加 -m。-m 会搜索sys.path路径,查找模块。
三、import的背后
'''callpackage.py'''import package1.run3 as r3print(__name__)r3.show_msg()'''__init__.py'''print(__file__)print(__name__)
'''run3.py'''import sysprint(__file__)print(__name__)paths=sorted(sys.path)for p in paths: print(p)def show_msg(): print('show_msg')
import package1.run3 内部运行了package1中的__init__.py种的程序,然后运行了run3.py中的程序;
而__name__,为包名.模块名。
import语句,会顺序级联方式运行引用包的__.init__.py及其后模块。__name__是一种模块引用的命名方式。
本文设计的概念很琐碎,只有把代码实际运行过,才能真正搞清楚python中隐藏的这些知识点。如果想自己制作一个pip安装的包,这些概念是基础。