常见的 Python 文件后缀有:py
、pyc
、pyo
、 pyi
、pyw
、 pyd
、 pyx
等。
本文只介绍相对常见的一些后缀名,至于一些特别冷门的文件格式,例如一些文章提到的pyz
、pywz
、rpy
、pyde
、pyp
、 pyt
等,并没有进行研究。因为这些扩展名资料很少,网上搜到的文章似乎都是同一个出处,只是简单提了一句,说了等于没说。
py
最常见的 Python 源代码文件。
实际上如果用 python + 文件
的方式运行代码,只要文件内容相同,后缀名是不重要的,也就是说下面的运行结果都是等价的:
python test.py
python test.txt
python test
pyc
常见的 Python 字节码缓存文件。
pyc
文件和py
文件一样,都可以直接执行,下面的运行结果都是等价的:
python test.py
python test.pyc
作用一:提升加载性能
我们知道 Python 代码在执行时,会先由 Python 解析器翻译成 PyCodeObject 对象,俗称字节码 (Byte code),然后交给 Python 解释器来执行字节码。
上述过程中翻译后的字节码是保存在内存中,程序运行结束就没了,而代码没有修改的情况下,每次生成的字节码是一样的,所以每次跑程序都再走一遍翻译字节码的过程有点浪费性能。因此为了提高加载效率,Python 在程序执行结束后会把每个文件的字节码写入到硬盘中保存为 xxx.pyc
文件,这样下一次再执行这个程序时先在目录下找有没有xxx.pyc
文件,如果有这个对应文件且修改时间和xxx.py
文件的修改时间一样,就不用再执行翻译成字节码的过程,直接读取xxx.pyc
文件执行。其实缓存pyc
文件的方式对性能的提升很微小,只有项目文件非常多的时候才能看到显著提升。
默认情况下,我们发现并不是所有的py
文件都会自动生成pyc
文件,只有被其他文件 import 过的文件才会生成对应的pyc
文件。可能 Python 认为被 import 的文件重复使用的概率比较高,而主文件一般只需要加载一次。
简单做个实验可以验证,新建两个 Python 文件hello.py
和import.py
,内容如下:
# hello.py
print("hello")
# import.py
impot hello
直接运行 python hello.py
,并没有生成pyc
文件,而运行python import.py
,在当前目录下生成了hello.py
对应的pyc
文件。
这里 Python2 和 Python3 有些不同, Python2 是直接在当前目录下生成同名 pyc
文件,Python3 是在当前目录下创建了__pycache__
文件夹,然后在文件夹内创建了一个包含 Python 版本信息的xxx.cpython-37.pyc
文件。
Python2
Python3
作用二:隐藏源代码
pyc
格式是给解释器看的二进制文件,直接用编辑器打开看上去是乱码,所以将 Python 代码先编译成pyc
文件再交付给别人使用,一定程度上实现隐藏源代码的效果。
默认情况下,主文件不会生成pyc
文件,可以通过 Python