机器学习中sklearn的pipeline如何使用?

本文介绍了如何在机器学习中使用sklearn的Pipeline来减少代码重复并提高流程的可读性。通过示例展示了如何创建Pipeline进行训练、测试,并在交叉验证中应用PCA和逻辑回归,以及如何设置参数进行网格搜索。
摘要由CSDN通过智能技术生成

本文和大家分享的主要是机器学习中 sklearnpipeline相关内容,一起来看看吧,希望对大家学习机器学习有所帮助。

  如图所示,利用pipeline我们可以方便的减少代码量同时让机器学习的流程变得直观,

例如我们需要做如下操作,容易看出,训练测试集重复了代码,

  vect = CountVectorizer()tfidf = TfidfTransformer()clf = SGDClassifier()

  vX = vect.fit_transform(Xtrain)tfidfX = tfidf.fit_transform(vX)predicted = clf.fit_predict(tfidfX)

  # Now evaluate all steps on test setvX = vect.fit_transform(Xtest)tfidfX = tfidf.fit_transform(vX)predicted = clf.fit_predict(tfidfX)

  利用pipeline,上面代码可以抽象为,

  pipeline = Pipeline([

  ('vect', CountVectorizer()),

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值