import是如何工作的

在Python中,导入时运行时发生的,第一次导入指定文件时,会执行三个步骤:

  1. 搜索:找到需要导入的模块文件。
  2. 编译:如果需要,编译为字节码文件。
  3. 运行:执行模块中的代码,创建其中定义的对象。

注意:这三个步骤只在程序执行时,模块第一次导入的情况下才会发生。之后导入相同模块时,会跳过这三个步骤,只提取内存中已经加载的模块对象。

Python会把载入的模块存在sys.modules字典中,并在导入操作开始时搜索该字典。如果没有找到模块,则启动这三个步骤。如下图所示:

导入流程

1 搜索

Python的模块搜索路径是以下路径的组合:

  1. 程序所在的主目录。
  2. 环境变量PYTHONPATH中定义的目录(如果设置了的话)。
  3. 标准库目录。
  4. 任何.pth路径文件中的罗列的目录(如果存在的话)。

其中第一和第三个是自动定义的,第二和第四个可以扩展,从而包含自定义的目录。这四个目录组合就是列表sys.path中的路径。导入时,Python会从左到右搜索该列表中的每一个目录。

通过在脚本中修改sys.path,可以在脚本存在期间改变模块搜索路径。而PYTHONPATH.pth文件提供了持久修改搜索路径的方法。

注意:如果不同目录中有同名的模块,Python总是加载sys.path中最先出现的模块。如果同一个目录下有同名,但后缀不同的模块文件(例如a.pya.so),此时加载顺序是不固定的。

1.1 主目录

Python首先会在主目录中搜索导入的模块。运行一个程序时,主目录是程序顶层脚本文件所在的目录;交互模式下,主目录是当前工作的目录。

Python总是先搜索主目录,所以它会覆盖其它路径中的同名模块。小心不要以这种方式意外地隐藏库模块。

1.2 PYTHONPATH目录

如果设置了PYTHONPATH环境变量,Python接着会从左到右搜索该环境变量中列出的所有目录。这些目录可以是用户自定义的,或者平台特定的目录。

如果所有模块文件都在主目录下,则用户不用操作该环境变量。当导入的模块跨目录时,则需要用户手动设置该环境变量。

1.3 标准库目录

之后,Python会自动搜索标准库模块所在的目录。这些目录一定会被搜索,因此不需要添加到PYTHONPATH,或者下一节介绍的.pth文件中。

1.4 .pth文件目录

最后,Python会搜索适当目录中后缀名为.pth文本文件,当其中每一行所列的目录存在时,会把目录从头到尾添加到模块搜索路径的最后。它提供了一种PYTHONPATH的代替方案。

路径文件在第三方库中经常使用,通常会在site-packages目录安装一个.pth文件,从而不需要用户设置第三方库需要的路径。

2 编译

遍历模块搜索路径,并找到符合import语句的源文件后,如果需要,Python会将其编译为字节码文件(.pyc文件)。

Python会检查该源文件的时间戳,如果字节码文件比源文件旧,则会在导入时重新生成字节码文件。如果字节码文件不比源文件旧,则会跳过编译步骤。

如果搜索路径上只有字节码文件,没有源文件,Python会直接加载字节码文件。因此,程序发布时,可以只发布字节码文件。

注意:当模块导入时,会进行编译。因此,通常不会看见顶层脚本文件的字节码文件,除非该文件被其它模块导入:只有被导入的文件才会在机器上留下字节码文件。顶层脚本文件的字节码在内部使用后就被丢弃了。

3 运行

导入操作的最后一个步骤是执行该模块的字节码。文件中所有语句会从头到尾依次执行,其中所有对变量名的赋值运算,都会成为模块的属性。例如,def语句会创建函数,并将这些函数赋值给模块内的属性。

参考资料:

  • Python学习手册(第四版)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值