统计学习方法-李航（3）

最新推荐文章于 2024-04-06 17:01:29 发布

萌即正义Zitrone

最新推荐文章于 2024-04-06 17:01:29 发布

阅读量261

点赞数

分类专栏：统计学习方法-李航文章标签：统计学习方法-李航（3）

本文链接：https://blog.csdn.net/qq_35629171/article/details/84331731

版权

统计学习方法-李航专栏收录该内容

6 篇文章 1 订阅

订阅专栏

统计学习方法-李航（第一章3）

模型评估与模型选择
正则化和交叉验证

模型评估与模型选择

训练误差与测试误差

统计学习的目的是使学到的模型不仅对已知数据而且对未知数据都能优很好的预测能力。
当损失函数是0-1损失时，测试误差就变成了常见的测试数据集上的误差率(error rate)。
$e_{test}=\frac{1}{N'}I(Y_i\neq\hat{f}(x_i))$
这里I是指示函数（indicator function），即 $Y_i\neq\hat{f}(x_i)$ 时为1，否则为0.
相应的，准确率为：
$r_{test}=\frac{1}{N'}I(Y_i=\hat{f}(x_i))$
显然 $e_{test}+r_{test}=1$
测试误差反映了学习方法对未知的测试数据集的预测能力，是学习的概念。测试误差小具有更好的预测能力。

过拟合与模型选择

选择的模型要与真模型参数个数相同，所选择的模型的参数向量与真模型的参数向量相近。
过拟合是指学习时选择的模型所包含的参数过多，以致于出现这一模型对已知数据预测的很好，对未知数据预测的很差的情况。

例如：多项式拟合

在多项式函数拟合中，随着多项式次数（模型复杂度）的增加，训练误差会减小，直至趋向于0，但是测试误差会随着多项式次数的增加先减小后增大。最终目的是使测试误差达到最小。

当选择的模型复杂度过大时，过拟合现象就会发生。在学习时如何选取最优的模型，达到测试误差最小的目的。方法：正则化和交叉验证。

正则化和交叉验证

正则化

正则化是结构风险最小化策略的实现，正则化项一般是模型复杂度的单调递增函数。比如正则化项可以是模型参数向量的参数。
一般形式：
$\min_{f\in F} \frac{1}{N}\sum_{i=1}^{N}L(y_i,f(x_i))+\lambda J(f)$
正则化项可以取不同的形式。

例如：回归问题

损失函数是平方损失，正则化项可以是参数向量的 $L_2$ 范数：
$\frac{1}{N}\sum_{i=1}^{N}L(f(x_i,w)-y_i)+\frac{\lambda}{2} ||w||^2$
这里 $∣ ∣ w ∣ ∣$ 表示参数向量 $w$ 的 $L_2$ 范数。

正则化项也可以是 $L_1$ 范数：
$\frac{1}{N}\sum_{i=1}^{N}L(f(x_i,w)-y_i)+\lambda||w||_1$
这里 $w|_1|$ 表示参数向量 $w$ 的 $L_1$ 范数。
正则化的作用是选择经验风险与模型复杂度同时较小的模型。正则化符合奥卡姆剃刀准则。