杂思|机器学习是不是就是把已有模型参数重新算,再做预测啊

比如回归方程模型(M1 = a+b*x),a是截距,b是斜率。对于一组数据来说,根据最小二乘法就能算出来最优斜率。
但有时候M1不能很好解释数据,可能不是因为模型,而是因为模型参数。
(Suppose M1 is found to be a poor approximation of the data. The poor data correspindence could simply be the result of the chocie of parameter values)

机器学习的思路,相当于把b当作自由参数,不用最小二乘算出适合这批数据的最佳参数值,而是通过损失函数(cost function)等迭代优化(optimization)找到最佳的参数值b,用这批数据60%-80%训练参数,用剩下的数据测试新的回归模型的预测效果。

感觉传统模型就是用各种fit index算固定值,比如M1用最小二乘法对这批数据算b,结果是固定的,模型的比较更像非好即坏;机器学习是用动态迭代算,不同数量的数据会训练出来不同的b,在模型理论无异议的情况下,模型可以不断优化。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
scikit-learn(sklearn)是一个基于Python的机器学习库,它提供了丰富的工具和法,用于数据预处理、特征选择、模型建立和评估等机器学习任务。在票房预测问题上,可以使用sklearn来构建预测模型。 首先,对于票房预测问题,我们需要收集相关的数据,包括电影的特征信息(如导演、演员、类型等)以及票房数据。然后,我们可以利用sklearn库中的数据预处理模块(如数据清洗、特征缩放等)对数据进行处理,以便于后续的模型建立。 接下来,我们可以使用sklearn中的特征选择模块,根据数据集的特征与目标变量的相关性进行特征选择。这将有助于减少冗余特征,提高预测模型的性能,并降低过拟合的风险。 然后,我们可以选择合适的机器学习法来构建预测模型。sklearn提供了多种经典的机器学习法,如线性回归、决策树、随机森林等。我们可以根据数据集的特点选择适合问题的法,并使用sklearn库中的模型建立模块进行建模。 建立好模型后,我们可以使用sklearn提供的模型评估模块对模型进行评估。通过使用交叉验证等方法,我们可以了解模型的泛化能力和性能,在需要时进一步调整模型参数,以改善预测结果。 最后,我们可以使用已训练的模型对新数据进行预测,以预测电影的票房。sklearn库提供了方便的接口,使得模型的应用和预测变得简单和高效。 总之,sklearn作为一个强大的机器学习库,可以帮助我们在票房预测问题上构建模型、选择特征、评估模型,并进行预测。通过合理利用sklearn库的功能和法,我们能够提高票房预测的准确性和效果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值