在学习 《特征工程入门与实践》 第三章,填充缺失值时,出现问题了
# 2.填充缺失值
from sklearn.preprocessing import Imputer
imputer = Imputer(strategy='mean')
pima_imputed = imputer.fit_transform(pima)
type(pima_imputed) # Imputer的输出值不是pandas的Dataframe,而是Numpy数组
报错提示:ImportError: cannot import name ‘Imputer’ from ‘sklearn.preprocessing’。
先来查看一下sklearn的版本:
import sklearn
print("Sklearn verion is {}".format(sklearn.__version__))
输出:Sklearn verion is 0.22.1
这下很明显了,我的sklearn版本是0.22.1,因为0.22版本的sklearn,imputer不在preprocessing里了,而是在sklearn.impute里,除了SimpleImputer外,还增加了KNNImputer,另外还有IterativeImputer用法。
将导入的方式改成from sklearn.impute import SimpleImputer
就好啦
from sklearn.impute import SimpleImputer
imputer = SimpleImputer(strategy='mean')
pima_imputed = imputer.fit_transform(pima)
type(pima_imputed) # Imputer的输出值不是pandas的Dataframe,而是Numpy数组
这样就能成功打印出pima_imputed的类型:numpy.ndarray