机器学习算法中的模型选择与假设评估

本文介绍了在机器学习中如何选择合适的算法和模型。当遇到预测误差较大时,可以考虑增加训练样本、减少特征数量、尝试额外特征或多项式组合、调整惩罚系数等方法。文章还涉及到模型选择、方差与偏差诊断以及学习曲线在评估模型性能中的应用。
摘要由CSDN通过智能技术生成

在掌握了机器学习算法后,接下来就需要对算法进行选择,在不同的问题下选择最合适的算法和模型进行处理。要知道在碰到不同的问题时应当走哪条解决方案,选择对了尝试的方向,才能够尽快的达到最优的解同时保证最优的性能。这篇文章就简要介绍一下碰到常规问题时如何解决,这些都是经验结论,在应对一些基础问题时一般都可以起到一定作用。

一、写在前面

首先需要了解大体上应当如何处理这类问题。当我们在预测时碰到问题,得到了较大的误差时,往往可以采用下面的方法:

  • 增加训练样本
  • 减小特征数量
  • 尝试其它额外的特征
  • 尝试特征的多项式组合
  • 调整惩罚系数
当我们需要对假设进行评估时,需要注意一个假设在训练样本上可能具有很小的误差,但是它依旧可能是不准确的(比如过拟合的情况下)。因此在需要评估假设时,往往会把给的训练集样本进行分割,一个经验值是按照7:3的比例将数据集分割为训练集(training set)和测试集(test set)。因此新的训练和测试过程应该按照如下的步骤:

  1. 根据样本学习得到Θ,同时最小化Jtrain(Θ) ;
  2. 计算测试集的误差Jte
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值