第十一章 应用机器学习的建议

本文详细介绍了机器学习中的诊断方法,包括评估假设、防止过拟合、选择模型、理解偏差与方差、正则化以及学习曲线的运用。通过训练集、验证集和测试集的划分,探讨如何有效地诊断并解决欠拟合和过拟合问题,以提高模型的泛化能力。
摘要由CSDN通过智能技术生成

目录

1 机器学习诊断

2 评估假设

过拟合

评估假设函数的标准方法

3 选择模型和训练验证测试集

4 诊断偏差与方差

5 正则化,偏差和方差

6 学习曲线

7 接下来怎么做


1 机器学习诊断

      当我们将假设函数放在检验集上测试时,发现了很大的偏差,这时,盲目的改正并不是一个合理的做法,通过机器学习性能评估和机器学习诊断可以了解算法在哪里出了问题,以及应当采用何种方式改进算法。

2 评估假设

过拟合

      当一个假设函数的特征参数较少的话,我们可以通过画出函数图像判断是否过拟合,但是一般情况下会存在很多特征参数,这种情况下就无法通过画图判断了。

评估假设函数的标准方法

      首先将所有样本分成两份,一部分称之为训练集,另一部分是测试集,一般而言,我们将两者的比例设置为7:3,同时要求保证选择两个集合的成员是完全随机的。

      然后我们需要对训练集进行学习获得参数\theta ,接下来使用获得的参数放在测试集中来计算测试误差。除了代价函数值之外,我们还可以通过一种被称之为错误分类,也叫01分类的测试度量定义测试误差,即对每一个测试集实例,计算:

然后对计算结果求平均值,也就是误分类的比率。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值