【机器学习】课程笔记09_应用机器学习的建议(Advice for Applying Machine Learning)

决定下一步做什么(Deciding What to Try Next)

  • 训练好了的模型来预测未知数据的时候发现有较大的误差,我们下一步可以做什么?

    • 获得更多的训练样本——通常是有效的,但代价较大,下面的方法也可能有效,可考虑先采用下面的几种方法。

    • 尝试减少特征的数量

    • 尝试获得更多的特征

    • 尝试增加多项式特征

    • 尝试减少正则化程度 λ \lambda λ

    • 尝试增加正则化程度 λ \lambda λ

  • 不应该随机选择上面的某种方法来改进我们的算法,而是运用一些机器学习诊断法来帮助我们知道上面哪些方法对我们的算法是有效的。

评估假设(Evaluating a Hypothesis)

  • 目的: 检验算法是否过拟合

  • 方法: 随机将数据分成训练集(70%)和测试集(30%),测试集评估在通过训练集让我们的模型学习得出其参数后,对测试集运用该模型,我们有两种方式计算误差:

    • 对于线性回归模型:

      • 利用测试集数据计算代价函数 J t e s t ( θ ) = 1 2 m t e s t ∑ i = 1 m t e s t ( h θ ( x t e s t ( i ) ) − y t e s t ( i ) ) 2 J_{test}(\theta)=\cfrac{1}{2m_{test}}\displaystyle\sum^{m_{test}}_{i=1}(h_\theta(x^{(i)}_{test})-y^{(i)}_{test})^2 Jtest(θ)=2mtest1i=1mtest(hθ(xtest(i))ytest(i))2.
    • 对于逻辑回归模型:

      • 利用测试机数据计算代价函数 J t e s t ( θ ) = − 1 m t e s t ∑ i = 1 m t e s t y t e s t ( i ) l o g h θ ( x t e s t ( i ) ) + ( 1 − y t e s t ( i ) ) l o g h θ ( 1 − x t e s t ( i ) ) J_{test}(\theta)=-\cfrac{1}{m_{test}}\displaystyle\sum^{m_{test}}_{i=1}y^{(i)}_{test}logh_\theta(x^{(i)}_{test})+(1-y^{(i)}_{test})logh_\theta(1-x^{(i)}_{test}) Jtest(θ)=

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

雀栎

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值