关于__pycache__文件夹
前言
__pycache__
一般位于一个python项目的工程根目录下,其中的文件均已各种.cpythton-36.pyc
结尾
例如:data.cpython-36.pyc
。
这里先解释一下后缀的意思:cpython
意思是c语言实现的Python解释器,-36
代表Python版本为3.6,至于pyc
,需要先了解一下模块调用的原理
一、模块的调用
Python中导入模块时,实际上会把被导入的模块执行一遍,如下:
创建一个被调用的模块test.py
:
def hello():
print("hello")
hello()
再看主程序main.py
:
import test
print("this is main.py")
执行结果是
hello
this is main.py
那怎么才能只是单纯调用而不执行被调用模块的代码呢?要想被调用模块代码不被执行,前提得知道变量__name__
是什么意思,简单来说就是,如果不涉及模块导入的话,__name__
的值就是 __main__
,如果当此模块被导入引用的话,那么这个模块内的__name__
值就是此模块文件的名字(不带.py),如下test_1.py
def hello():
print("hello")
hello()
print(__name__)
我们运行test_1.py
之后,执行结果为:
hello
__main__
但是如果我们将test_1.py
作为模块放到test_2.py
调用,这时输出将是test_1
的名称,例如我们的test_2.py
这样写:
import test_1
print("this is test_2.py")
我们运行test_2.py
之后,执行结果为:
hello
test_1
this is test_2.py
如果再在test_1.py
,test_2.py
各自加入一个判断的魔法语句if __name__ == "__main__":
那么被调用模块中,除了该被调用的文件(模块)内属于判断语句的所有函数调用都不会被执行。
比如test_1.py
中
def hello():
print("hello")
print(__name__)
if __name__ == "__main__":
hello()
在test_2.py
中
import test
print("this is testMain.py")
if __name__ == "__main__":
test.hello()
最后输出:【大家可以自行想一下】
test_1 # import test_1.py的输出
this is testMain.py
hello
正题
以下参考自Joy_Shen的一个回答。
先大概了解一下python基本运行机制。Python程序运行时不需要编译成二进制代码,而直接从源码运行程序,简单来说是,Python解释器将源码转换为字节码,然后再由解释器来执行这些字节码。
解释器的具体工作:
1、完成模块的加载和链接;
2、将源代码编译为PyCodeObject
对象(即字节码),写入内存中,供CPU读取;
3、从内存中读取并执行,结束后将PyCodeObject
写回硬盘当中,也就是复制到.pyc
或.pyo
文件中,以保存当前目录下所有脚本的字节码文件。
之后若再次执行该脚本,它先检查【本地是否有上述字节码文件】和【该字节码文件的修改时间是否在其源文件之后】,是就直接执行,否则重复上述步骤。
那有的小伙伴就有疑问了,__pycache__
文件夹的意义何在呢?
因为第一次执行代码的时候,Python解释器已经把编译的字节码放在__pycache__
文件夹中。
这样以后再次运行的话,如果被调用的模块未发生改变,那就直接跳过编译这一步,直接去__pycache__
文件夹中去运行相关的 *.pyc
文件,大大缩短了项目运行前的准备时间。
总结
- Python文件作为模块被调用时,其
__name__
变量指向当前文件名 - Python解释器类似于java的JVM,将代码编译为字节码(
PyCodeObject
)后加载至内存,读取并执行 __pycache__
文件中保存的是最近一次未被修改的已编译的字节码文件,从而加速项目运行速度