机器学习第六周（二）

最新推荐文章于 2024-04-03 15:38:19 发布

shiyongraow

最新推荐文章于 2024-04-03 15:38:19 发布

阅读量1.2k

点赞数

分类专栏：机器学习机器学习笔记文章标签：机器学习偏差方差

本文链接：https://blog.csdn.net/shiyongraow/article/details/77754368

版权

机器学习同时被 2 个专栏收录

31 篇文章 1 订阅

订阅专栏

机器学习笔记

28 篇文章 5 订阅

订阅专栏

偏差（bias）与方差（Variance）

以熟悉的三个例子开始：
这里写图片描述
在上一讲中引入了测试误差和多项式次数。在这里，计算训练误差和交叉验证误差。

更详细如下：

即随着多项式次数d的不断增大，训练误差是不断减小的，验证误差再到达最佳多项式次数前也是不断减小，随后不断增加，为一个凸函数形式。

由这个图我们得到：
这里写图片描述
即当训练误差和验证误差近似相等且都比较大时，判断为高偏差、欠拟合（high bias、underfitting）
当训练误差非常小，验证误差非常大且远远大于训练误差，判定为高方差、过拟合（high variance、overfitting）

正则化与偏差、方差

在三个模型中引入lambda
这里写图片描述
当lambda过大时，假设函数为一条平行于x轴的直线，欠拟合。
当lambda为0时，欠拟合。
如何选择lambda？使正好”just right”达到图2的效果。
1）、取不同的lambda，比如这里取12个，0.01开始，步长为2倍的速度，得到12个模型
2）、第一个模型开始，lambda=0，最小化代价函数J（theta），得到某个参数向量theta
3）、计算剩下的模型，得到对应的参数向量theta
4）、用交叉验证集评价这些参数。评价每个模型
5）、测出每一个参数theta在交叉验证集上的误差平方和，取出这12个模型中的误差最小的作为最终选择。
这里写图片描述

正则化参数λ对交叉验证集误差和训练集误差产生的影响

当λ改变时，交叉验证集误差和训练误差会发生怎样的变化呢？？？
lambda变化的影响
注意：我们最初的代价函数J(θ)是包含正则化项的，但在这里我们把训练误差和交叉验证集误差定义为不包括正则化项。
λ在训练集上的变化：
你就会发现当λ的取值很小时，对训练集的拟合相对较好，因为没有使用正则化。而如果λ的值很大时，你将处于高偏差问题，不能对训练集很好地拟合，训练集误差Jtrain(θ)的值会趋于上升。
λ在交叉验证集上的变化：
在曲线的右端，当λ的值取得很大时，我们会处于欠拟合问题。这对应着偏差问题，那么此时交叉验证集误差将会很大。
在曲线的左端，对应的是高方差问题，此时我们的λλ值取得很小很小，因此我们会对数据过度拟合，所以交叉验证集误差也会很大。