sklearn.pipeline中的 Pipeline（管道机制）

最新推荐文章于 2024-08-03 18:21:56 发布

Foneone

最新推荐文章于 2024-08-03 18:21:56 发布

阅读量2.3k

点赞数 1

分类专栏：机器学习文章标签： sklearn Pipeline

本文链接：https://blog.csdn.net/foneone/article/details/102057156

版权

机器学习专栏收录该内容

8 篇文章 6 订阅

订阅专栏

管道机制是按照封装顺序依次执行的一种机制，在机器学习算法中得以应用的根源在于，参数集在新数据集（比如测试集）上的重复使用。

具体代码如下：

from sklearn.pipeline import Pipeline #管道机制
from sklearn.preprocessing import StandardScaler #标准化数据
from sklearn import datasets #数据集
from sklearn.model_selection import train_test_split #分训练和测试集
from sklearn.neighbors import KNeighborsClassifier #knn分类 

iris = datasets.load_iris()
X_train,X_test,y_train,y_test = train_test_split(iris.data,\
                        iris.target,test_size=0.1)

pipe=Pipeline(steps=[('standardScaler',StandardScaler()),\
                     ('knn',KNeighborsClassifier(n_neighbors=5))])
pipe.fit(X_train,y_train) #训练模型
pipe.predict(X_test) #预测结果
print('Test accuracy: %.3f' % pipe.score(X_test, y_test))#输出精度

Pipeline中的steps是一个列表结构，里面是由一个个tuple构成，上述代码中包括两个结构：（1）均一化（2）KNN分类器。不管steps中有几个tuple，最后一个一定要是分类器（回归器），前面的可以是各种处理数据的模块。

在每个模块中，可以写入模块中所用的参数。

参考：https://blog.csdn.net/lanchunhui/article/details/50521648

Foneone

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
sklearn.pipeline中的 Pipeline（管道机制）

管道机制是按照封装顺序依次执行的一种机制，在机器学习算法中得以应用的根源在于，参数集在新数据集（比如测试集）上的重复使用。具体代码如下：from sklearn.pipeline import Pipeline #管道机制from sklearn.preprocessing import StandardScaler #标准化数据from sklearn import dataset...
复制链接

扫一扫