【统计学习笔记】泛化误差上界

最新推荐文章于 2021-08-20 15:11:22 发布

喜欢什么的只是说说而已

最新推荐文章于 2021-08-20 15:11:22 发布

阅读量1k

点赞数 1

分类专栏：统计学习文章标签：机器学习

本文链接：https://blog.csdn.net/qq_39573785/article/details/107192894

版权

统计学习专栏收录该内容

14 篇文章 0 订阅

订阅专栏

【统计学习笔记】泛化误差上界

1. 泛化误差
2. 泛化误差上界

1. 泛化误差

学习方法的泛化能力是指由该方法学习到的模型对未知数据的预测能力，是学习方法本质上重要的性质。测试误差是依赖于测试数据集的，泛化误差是理论上的概念，如果学到的模型是 $\hat{f}$ ，那么这个模型对未知数据预测的误差即为泛化误差：
$R_{exp}(\hat{f})=E_P[L(Y,\hat{f}(X))]=\int_{\mathcal{X}\times\mathcal{Y}}L(y,\hat{f}(x))P(x,y)dxdy ……（1)$
泛化误差就是学习到的模型的期望风险。

2. 泛化误差上界

学习方法的泛化能力分析往往是研究泛化误差的概率上界，简称泛化误差上界。我们先用一个简单的二分类问题的例子来理解泛化上界：
设训练数据集 $T={(x_1,y1),(x_2,y_2),\cdots ,(x_N,y_N)}$ ，T是从联合概率分布P(X,Y)独立同分布产生的， $X\in R^n, Y\in \{-1,+1\}$ ，假设空间是函数的有限集合 $\mathcal{F}=\{f_1,f_2,\cdots ,f_d\}$ ，设f是从 $\mathcal{F}$ 中选取的函数，损失函数是0-1损失，则关于f的期望风险和经验风险分别是：
$……（2）\\ \hat{R}(f)=\frac{1}{N}\sum\limits_{i=1}^NL(y_i,f(x_i)) ……（3）$
经验风险最小化函数是：
$f_N=arg\min\limits_{f\in\mathcal{F}}\hat{R}(f)……（4）$
f_N依赖于样本，因为只能从样本得到模型，所以人们更关心的是f_N的泛化能力。
$R(f_N)=E[L(Y,f_N(X))] ……（5）$
在这里插入图片描述