Python包和官方库的导入原理

最新推荐文章于 2024-07-22 15:52:46 发布

口袋的天空Zard

最新推荐文章于 2024-07-22 15:52:46 发布

阅读量3.8k

点赞数 5

分类专栏： python

本文链接：https://blog.csdn.net/qq_37423198/article/details/77328168

版权

python 专栏收录该内容

7 篇文章 1 订阅

订阅专栏

Python包和官方库的导入原理

1.安装的python库文件夹的位置

对于用pip安装的python库，安装于此路径：

这里写图片描述

sklearn库的位置(举sklearn库为例)：

这里写图片描述

2.init.py文件

init.py 文件的作用是将文件夹变为一个Python模块,Python 中的每个模块的包中，都有init.py 文件。

通常init.py 文件为空，但是我们还可以为它增加其他的功能。我们在导入一个包时，实际上是导入了它的init.py文件。这样我们可以在init.py文件中批量导入我们所需要的模块，而不再需要一个一个的导入。

这里写图片描述

示例：package包下的init文件：

# package
# __init__.py
import re
import urllib
import sys
import os
# a.py
import package 
print(package.re, package.urllib, package.sys, package.os)

init.py中还有一个重要的变量，all, 它用来将模块全部导入。

# __init__.py
__all__ = ['os', 'sys', 're', 'urllib']
# a.py
from package import *

这时就会把注册在init.py文件中all列表中的模块和包导入到当前文件中来。

可以了解到，init.py主要控制包的导入行为。

3.import语句

可以被import语句导入的对象是以下类型：

•模块文件（.py文件）

•C或C++扩展（已编译为共享库或DLL文件）

•包（包含多个模块）

•内建模块（使用C编写并已链接到Python解释器中）

当导入模块时，解释器按照sys.path列表中的目录顺序来查找导入文件。

import sys
>>> print(sys.path)
# Linux:
['', '/usr/local/lib/python3.4',
'/usr/local/lib/python3.4/plat-sunos5',
'/usr/local/lib/python3.4/lib-tk',
'/usr/local/lib/python3.4/lib-dynload',
'/usr/local/lib/python3.4/site-packages']
# Windows:
['', 'C:\\WINDOWS\\system32\\python34.zip', 'C:\\Documents and Settings\\weizhong', 'C:\\Python34\\DLLs', 'C:\\Python34\\lib', 'C:\\Python34\\lib\\plat-win', 'C:\\Python34\\lib\\lib-tk', 'C:\\Python34\\Lib\\site-packages\\pythonwin', 'C:\\Python34', 'C:\\Python34\\lib\\site-packages', 'C:\\Python34\\lib\\site-packages\\win32', 'C:\\Python34\\lib\\site-packages\\win32\\lib', 'C:\\Python34\\lib\\site-packages\\wx-2.6-msw-unicode']

['',
 'C:\\Windows\\SYSTEM32\\python27.zip',
 'c:\\python27\\DLLs',
 'c:\\python27\\lib',
 'c:\\python27\\lib\\plat-win',
 'c:\\python27\\lib\\lib-tk',
 'c:\\python27',
 'c:\\python27\\lib\\site-packages',
 'c:\\python27\\lib\\site-packages\\virtualenv-15.1.0-py2.7.egg',
 'c:\\python27\\lib\\site-packages\\lxml-3.7.3-py2.7-win32.egg',
 'c:\\python27\\lib\\site-packages\\scrapy-1.3.3-py2.7.egg',
 'c:\\python27\\lib\\site-packages\\service_identity-16.0.0-py2.7.egg',
 'c:\\python27\\lib\\site-packages\\pydispatcher-2.0.5-py2.7.egg',
 'c:\\python27\\lib\\site-packages\\parsel-1.1.0-py2.7.egg',
 'c:\\python27\\lib\\site-packages\\cssselect-1.0.1-py2.7.egg',
 'c:\\python27\\lib\\site-packages\\pyopenssl-16.2.0-py2.7.egg',
 'c:\\python27\\lib\\site-packages\\queuelib-1.4.2-py2.7.egg',
 'c:\\python27\\lib\\site-packages\\w3lib-1.17.0-py2.7.egg',
 'c:\\python27\\lib\\site-packages\\xgboost-0.6-py2.7.egg',
 'c:\\python27\\lib\\site-packages\\IPython\\extensions',
 'C:\\Users\\HY\\.ipython']

.py文件的汇编,只有在import语句执行时进行，当.py文件第一次被导入时，它会被汇编为字节代码，并将字节码写入同名的.pyc文件中。后来每次导入操作都会直接执行.pyc 文件（当.py文件的修改时间发生改变，这样会生成新的.pyc文件），在解释器使用-O选项时，将使用同名的.pyo文件，这个文件去掉了断言（assert）、断行号以及其他调试信息，体积更小，运行更快。（使用-OO选项，生成的.pyo文件会忽略文档信息）

导入模块

模块通常为单独的.py文件，可以用import直接引用，可以作为模块的文件类型有.py、.pyo、.pyc、.pyd、.so、.dll

在导入模块时，解释器做以下工作：

1.已导入模块的名称创建新的命名空间，通过该命名空间就可以访问导入模块的属性和方法。

2.在新创建的命名空间中执行源代码文件。

3.创建一个名为源代码文件的对象，该对象引用模块的名字空间，这样就可以通过这个对象访问模块中的函数及变量

import 语句可以在程序的任何位置使用，你可以在程序中多次导入同一个模块，但模块中的代码仅仅在该模块被首次导入时执行。后面的import语句只是简单的创建一个到模块名字空间的引用而已。

sys.modules字典中保存着所有被导入模块的模块名到模块对象的映射。

4.sklearn的init.py文件：

try:
    # This variable is injected in the __builtins__ by the build
    # process. It used to enable importing subpackages of sklearn when
    # the binaries are not built
    __SKLEARN_SETUP__
except NameError:
    __SKLEARN_SETUP__ = False

if __SKLEARN_SETUP__:
    sys.stderr.write('Partial import of sklearn during the build process.\n')
    # We are not importing the rest of the scikit during the build
    # process, as it may not be compiled yet
else:
    from . import __check_build
    from .base import clone
    __check_build  # avoid flakes unused variable error

    __all__ = ['calibration', 'cluster', 'covariance', 'cross_decomposition',
               'cross_validation', 'datasets', 'decomposition', 'dummy',
               'ensemble', 'exceptions', 'externals', 'feature_extraction',
               'feature_selection', 'gaussian_process', 'grid_search',
               'isotonic', 'kernel_approximation', 'kernel_ridge',
               'lda', 'learning_curve', 'linear_model', 'manifold', 'metrics',
               'mixture', 'model_selection', 'multiclass', 'multioutput',
               'naive_bayes', 'neighbors', 'neural_network', 'pipeline',
               'preprocessing', 'qda', 'random_projection', 'semi_supervised',
               'svm', 'tree', 'discriminant_analysis',
               # Non-modules:
               'clone']

5.导入方式

. 表示当前.py文件所在目录文件夹下

from .base import is_classifier, clone
#导入当前文件夹下base.py文件里的is_classifier,clone函数
from .utils import indexable, check_random_state, safe_indexing
from .utils.validation import (_is_arraylike, _num_samples,
                               column_or_1d)
#导入当前文件夹下utils文件夹的validation.py文件中的_is_arraylike等函数
from .utils.multiclass import type_of_target
from .utils.random import choice
from .externals.joblib import Parallel, delayed, logger
from .externals.six import with_metaclass
from .externals.six.moves import zip
from .metrics.scorer import check_scoring
from .utils.fixes import bincount
from .gaussian_process.kernels import Kernel as GPKernel
from .exceptions import FitFailedWarning