统计学习方法-李航（4）

最新推荐文章于 2022-04-03 15:02:06 发布

萌即正义Zitrone

最新推荐文章于 2022-04-03 15:02:06 发布

阅读量149

点赞数 1

分类专栏：统计学习方法-李航文章标签：统计学习方法-李航（4）

本文链接：https://blog.csdn.net/qq_35629171/article/details/84332354

版权

统计学习方法-李航专栏收录该内容

6 篇文章 1 订阅

订阅专栏

统计学习方法-李航（第一章4）

泛化能力

泛化能力

泛化误差

学习方法的泛化能力是指由该方法学习到的模型对未知数据的预测能力。现实中采用最多的办法是通过测试误差来评价学习方法的泛化能力，但这种评价依赖测试数据集，测试数据集是有限的。
统计上试图从理论上对学习方法的泛化能力进行分析。
如果学到的模型是 $\hat f$ ，那么对未知数据预测的误差即为泛化误差（generalization error）：
$R_{exp}(\hat f)=E_p[L(Y,\hat f(X))]=\int_{X*Y}L(y,\hat f(x))P(x,y)dxdy$

泛化误差上界

性质：
1、它是样本容量的函数，当样本容量增加时，泛化上界趋于0；
2、它是假设空间容量的函数，假设空间容量越大，模型就越难学，泛化误差上界就越大。

考虑二分类问题的泛化误差上界

已知训练数据集 $T=\{(x_1,y_1),(x_2,y_2),... ,(x_N,y_N)\}$ ,它是从联合概率分布 $P (X, Y)$ 独立同分布产生的， $X\in R^n,Y\in\{ -1,+1\}$ 。假设空间是函数的有限集合 $F=\{ f_1,f_2,...,f_d\}$ , $d$ 是函数个数。设 $f$ 是从 $F$ 中选取的函数，损失函数是0-1损失。关于 $f$ 的期望风险和经验风险是：
$R (f) = E [L (Y, f (X))]$
$\hat R( f)=\frac{1}{N}\sum_{i=1}^NL(y_i,f(x_i))$
经验风险最小化函数为：
$f_N=arg\min_{f\in F}\hat R(f)$
$f_N$ 的泛化能力 $R( f_N)=E[L(Y, f_N(X))]$ .
讨论 $F=\{ f_1,f_2,...,f_d\}$ 中任意选出的函数 $f$ 的泛化误差上界。

泛化误差上界定理

泛化误差上界定理证明

泛化误差上界定理证明
训练误差小的模型，泛化误差也会小。
以上讨论的只是假设空间包含有限个函数情况下的泛化误差上界。

萌即正义Zitrone

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法-李航（4）

统计学习方法-李航（第一章4）泛化能力泛化误差泛化误差上界考虑二分类问题的泛化误差上界泛化误差上界定理泛化误差上界定理证明泛化能力泛化误差学习方法的泛化能力是指由该方法学习到的模型对未知数据的预测能力。现实中采用最多的办法是通过测试误差来评价学习方法的泛化能力，但这种评价依赖测试数据集，测试数据集是有限的。统计上试图从理论上对学习方法的泛化能力进行分析。如果学到的模型是f^\hat ff...
复制链接

扫一扫