起源
今天和一新来的同事沟通,说他用python编写了一个工程,但在第一次运行后,发现工程根目录下生成了一个__pycache__文件夹,里面是和py文件同名的各种以 .cpython-35.pyc
结尾的文件,问同事都不太清楚,所以便抽空整理了一下该知识点。先解释下cpython-35,cpython代表的是c语言实现的Python解释器,-35代表的是版本为3.5版。
为什么会出现__pycache__文件夹?
python解释器会将 *.py 脚本文件进行编译,并将编译结果保存到__pycache__目录中。
下次再执行工程时,若解释器发现这个 *.py 脚本没有修改过,就会跳过编译这一步,直接运行以前生成的保存在 __pycache__文件夹里的 *.pyc 文件。
这样工程较大时就可以大大缩短项目运行前的准备时间;如果你只需执行一个小工程,没关系 忽略这个文件夹就行。
如何使__pycache__文件夹不出现?(不建议这么做,降低运行效率)
单次: 运行脚本时添加 -B 参数
python -B foo.py
永久: 设置环境变量 PYTHONDONTWRITEBYTECODE=1
_name_ == ‘_main_‘的作用是啥呢?
先来了解一下模块的调用。
Python中导入模块时,实际上会把被导入的模块执行一遍,如下:
先看被调用的模块test.py:
def demo():
print("哈哈")
demo()
再看主程序run.py:
import test
print("一条大树")
执行结果是:
哈哈
一条大树
那怎么才能只是单纯调用而不执行被调用模块的代码呢?要想被调用模块代码不被执行,前提得知道变量__name__是什么意思,简单来说就是,如果不涉及模块导入的话,__name__的值就是” main“,如果当此模块被导入引用的话,那么这个模块内的__name__值就是文件的名字(不带.py),如下test_1.py:
def demo():
print("哈哈")
demo()
print(__name__)
test_1.py执行结果为:
哈哈
__main__
如果test_1被导入引用的话,如test_2:
import test_1
print("一条大树")
test_2x运行结果为:
哈哈
test_1
一条大树
上边所说要是弄懂的话,那我们在被调用的模块中,可执行的代码前加上这么一句判断,if name == ‘main’:,被调用的模块的代码就不会被执行了!
先大概了解一下python基本运行机制。Python程序运行时不需要编译成二进制代码,而直接从源码运行程序,简单来说是,Python解释器将源码转换为字节码,然后再由解释器来执行这些字节码。
解释器的具体工作:
1、完成模块的加载和链接;
2、将源代码编译为PyCodeObject对象(即字节码),写入内存中,供CPU读取;
3、从内存中读取并执行,结束后将PyCodeObject写回硬盘当中,也就是复制到.pyc或.pyo文件中,以保存当前目录下所有脚本的字节码文件。
之后若再次执行该脚本,它先检查【本地是否有上述字节码文件】和【该字节码文件的修改时间是否在其源文件之后】,是就直接执行,否则重复上述步骤。
那有的小伙伴就有疑问了,__pycache__文件夹的意义何在呢?
因为第一次执行代码的时候,Python解释器已经把编译的字节码放在__pycache__文件夹中,这样以后再次运行的话,如果被调用的模块未发生改变,那就直接跳过编译这一步,直接去__pycache__文件夹中去运行相关的 *.pyc 文件,大大缩短了项目运行前的准备时间。