python sklearn fit_python – Sklearn Fit模型多次

问题的根源很常见:

存在大量的列车数据,这些数据是以块的形式读取的.兴趣点是在分块数据集上顺序拟合所需模型,保持先前拟合的状态.

除了partial_fit()之外,是否有任何方法可以在不同的数据上使用sklearn来拟合模型?或者是否有任何技巧来重写fit()函数的代码来为这个问题定制它?或者有可能某些人意识到泡菜?

解决方法:

有些模型暴露partial_fit()而其他模型没有暴露的原因.每个模型都是不同的机器学习算法,对于许多这些算法,如果不从头开始重新计算模型,就无法添加元素.

因此,如果必须逐步拟合模型,请选择具有partial_fit()的增量模型.您可以在this documentation page找到完整列表.

或者,您可以构建一个集合模型.为您拥有的每个数据块创建单独的Classifier()或Regression().然后,当你需要预测某些东西时,你可以

for classifier in classifiers:

votes[classifier.predict(X)] += 1

prediction = numpy.argmax(votes)

或者,对于回归量

prediction = numpy.mean([regressor.predict(X) for regressor in regressors]

标签:python,scikit-learn

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值