斯坦福机器学习笔记五

最新推荐文章于 2022-05-19 01:14:21 发布

羊和咩咩

最新推荐文章于 2022-05-19 01:14:21 发布

阅读量888

点赞数 2

分类专栏：机器学习笔记

本文链接：https://blog.csdn.net/a_yangfh/article/details/70992331

版权

机器学习笔记专栏收录该内容

12 篇文章 2 订阅

订阅专栏

机器学习诊断法

有时候发现训练出来的模型误差很大，会有很多解决办法。例如：增加更多的训练样本，减少特征数目，增加特征数目，增加多项式特征，减小或增大正则化参数 λ 的值。但是这些尝试往往会浪费很多时间，所有这里提出了一种机器学习诊断法。

1、数据的分配

将数据分为三部分，训练集（60%）、交叉验证集（20%）和测试集（20%）。利用训练集，选择最优的多项式个数及其参数；利用交叉验证集代入到拟合出来的函数中，计算代价函数的值，最后选择代价函数最小的拟合函数。最后再用测试集来验证。

2、诊断偏差与方差

如果一个算法的表现不理想，那么多半是两种情况：要么是偏差比较大（欠拟合），要么是方差比较大（过拟合）。
通过将训练集和交叉验证集的代价函数误差与多项式的次数绘制在同一种图标上来分析：

这里写图片描述

当多项式（d）较小时，训练集拟合模型处于欠拟合状态，误差较大，交叉验证集的误差也较大；随着d的增长，训练集拟合模型拟合程度高，误差减小，交叉验证集的误差呈现先减小后增大的趋势，转折点就是最优的多项式取值，过了转折点，模型处于过拟合状态。

最后得出结论：当训练集误差和交叉验证集误差近似时，模型处于高偏差、欠拟合状态。当交叉验证集误差远大于训练集误差是，模型处于高方差、过拟合状态。

3、正则化参数λ的选择

如果正则化参数过大，则会把所有的参数都最小化，导致假设函数变成一条直线，造成欠拟合。如果正则化参数过小，又无法避免过拟合现象。

选择 λ的具体步骤如下：
首先，创建一个λ 列表： (i.e. λ∈{0,0.01,0.02,0.04,0.08,0.16,0.32,0.64,1.28,2.56,5.12,10.24})
差不多以两倍的关系取值。然后，使用这些λ 值和训练集一起训练出不同的模型，得到一些θ 值。
最后，将交叉检测集代入这些模型，选择代价函数最少的θ和 λ值。这里需要注意的是，交叉验证集的代价函数没有正则化项。

$J\left( \text{ }\!\!\theta\!\!\text{ } \right)=\frac{1}{2m}\underset{i=1}{\overset{m}{\mathop \sum }}\,{{\left( {{h}_{\theta }}\left( {{x}^{\left( i \right)}} \right)-{{y}^{\left( i \right)}} \right)}^{2}}+\frac{\lambda }{2m}\underset{\text{j}=1}{\overset{n}{\mathop \sum }}\,\theta _{j}^{2}$
${{J}_{train}}\left( \text{ }\!\!\theta\!\!\text{ } \right)=\frac{1}{2m}\underset{i=1}{\overset{m}{\mathop \sum }}\,{{\left( {{h}_{\theta }}\left( \text{x}_{train}^{\left( i \right)} \right)-\text{y}_{train}^{\left( i \right)} \right)}^{2}}$
${{J}_{cv}}\left( \text{ }\!\!\theta\!\!\text{ } \right)=\frac{1}{2m}\underset{i=1}{\overset{m}{\mathop \sum }}\,{{\left( {{h}_{\theta }}\left( \text{x}_{cv}^{\left( i \right)} \right)-\text{y}_{cv}^{\left( i \right)} \right)}^{2}}$