是这样的,今天在做机器学习课后作业的时候,打算导入 sklearn 自带的数据集
In [1]: import sklearn
In [2]: iris = sklearn.datasets.load_iris()
运行的时候会报错,就很迷
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-3-f0583f191f9a> in <module>
----> 1 iris = sklearn.datasets.load_iris()
2 iris
AttributeError: module 'sklearn' has no attribute 'datasets'
但是,我参考了一下别人的,却不会报错
In [3]: from sklearn import datasets
In [4]: iris = datasets.load_iris()
于是去百度了一下,看到一个比较好的参考答案,记录如下
sklearn
是一个 packag
e。This answer 说得非常简洁:
when you import a package, only variables/functions/classes in the init.py file of that package are directly visible, not sub-packages or modules.
datasets
是 sklearn
的子包。这就是为什么会发生这种情况:
In [1]: import sklearn
In [2]: sklearn.datasets
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-2-325a2bfc35d0> in <module>()
----> 1 sklearn.datasets
AttributeError: module 'sklearn' has no attribute 'datasets'
但是,这样做的原因是:
In [3]: from sklearn import datasets
In [4]: sklearn.datasets
Out[4]: <module 'sklearn.datasets' from '/home/ethan/.virtualenvs/test3/lib/python3.5/site-packages/sklearn/datasets/__init__.py'>
当通过执行 from sklearn import datasets
加载子包 datasets
时,它会自动添加到包 sklearn
的命名空间中。这是一个鲜为人知的 “traps” of the Python import system。
另外,请注意,如果您查看^{} for {},则将作为{}的成员查看’datasets’,但这只允许您执行以下操作:
In [1]: from sklearn import *
In [2]: datasets
Out[2]: <module 'sklearn.datasets' from '/home/ethan/.virtualenvs/test3/lib/python3.5/site-packages/sklearn/datasets/__init__.py'>
最后要注意的一点是,如果您检查 sklearn
或 datasets
,您将看到,尽管它们是包,但它们的类型是 module
。这是因为所有的包都被认为是模块-但是,并不是所有的模块都是包。