机器学习优化模型——经验风险及其一般优化模型

最新推荐文章于 2024-06-03 18:26:30 发布

Zoro1996

最新推荐文章于 2024-06-03 18:26:30 发布

阅读量957

点赞数

分类专栏：机器学习个人学习人工智能文章标签：机器学习

本文链接：https://blog.csdn.net/qq_33997826/article/details/104935067

版权

本文深入探讨了机器学习中的经验风险及其一般优化模型，从损失函数出发，阐述了经验风险和期望风险的区别，以及泛化误差的重要性。通过Hoeffding不等式分析了泛化误差的界限，并指出样本数量和VC维对模型泛化能力的影响。

摘要由CSDN通过智能技术生成

文章目录

1.经验风险及其一般优化模型

1.1损失函数:

损失函数 $L(f(X_i),Y_i)$ 是针对单个样本而言的,表示模型预测值与样本真实值之间的差距。常见损失函数:
1.0-1损失函数
$\begin{cases} 0,Y\not=f(x)\\ 1,Y=f(x) \end{cases}$
2.平方损失函数
$L(Y,f(x))=(Y-f(x))^2$
3.绝对损失函数
$L (Y, f (x)) = ∣ Y - f (x) ∣$
4.对数损失函数或者对数似然损失函数
$L (Y, P (Y ∣ X)) = - l o g P (Y ∣ X)$
通过选取上述任一损失函数,我们可以衡量针对某一具体样本点的测量值和真实值之间的差异度的方法。损失函数越小,说明模型预测结果越准确。

对所有样本点计算其损失函数,加起来求和取平均,就可以得到模型在该训练样本集中的平均损失,也叫做经验风险。
$R_{emp}(f)=\frac{1}{N}\sum_{i=1}^N{L(y_i,f(x_i))} \tag{1.1}$

1.2经验风险及其一般优化模型

定义1 经验风险 : 训练集中所有额样本点的损失函数的平均。
经验误差只是模型在训练集上的表现,对于未知样本,是不是只有上帝才能知道它的效果呢?非也。借助数学工具,我们可以充当“上帝”的角色,去预测模型在未知样本上的表现性能。

定义2 期望风险(真实风险): 假设全体样本(包括已知样本和未知样本)为 $X$ ,他的真实结果是 $Y$ ,预测结果是 $f (x)$ 。期望风险可以表示为:
$R_{exp}(f)=E_r[L(Y,f(X))]=\int_{x \times y}{}L(y,f(x))p(x,y)dxdy \tag{1.2}$
期望风险与经验风险的不同之处在于,期望风险是全局的概念,表示的是决策函数对所有样本的预测能力;而经验风险反映的是决策函数对训练集样本的预测能力。

只有上帝知道期望风险的真实值,我们需要做的,使用局部最优替代全局最优???

定义3 泛化误差:针对这样一个问题:在一个有限的样本集合上的评价和一个无限的数据集合上的评价是否一致?

如果一个算法 $f^*$ 在全体数据集 $D$ 上是最好的,则算法的期望风险最小,又叫做贝叶斯风险,是理论上可达到的最小风险。

$f^* :$ 全体数据集 $\mathbb{D}$ 上在无限多的算法中找到的最好的算法。反映理论上可以预测多好,对应的真实风险 $R^*$

$f^*_{\mathcal{F}}:$ 全体数据集 $\mathbb{D}$ 上在有限算法 $\mathbb{F}$ 上选出的最佳算法 .对应的真实风险是 $R_{exp}(f^*_{\mathcal{F}})$

$\hat{f_{\mathcal{F}}}:$ 有限数据集 $\mathbb{S}$ 上,在有限个算法集合 $\mathbb{F}$ 里选出的最佳算法。对应的真实风险是 $R_{emp}(\hat{f}_{\mathcal{F}})$

最低0.47元/天解锁文章

Zoro1996

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习优化模型——经验风险及其一般优化模型

文章目录1.经验风险及其一般优化模型1.1损失函数:1.2经验风险及其一般优化模型1.3泛化误差界1.4 经验风险与泛化误差概述2. VC维1.经验风险及其一般优化模型1.1损失函数:损失函数L(f(Xi),Yi)L(f(X_i),Y_i)L(f(Xi),Yi)是针对单个样本而言的,表示模型预测值与样本真实值之间的差距。常见损失函数:1.0-1损失函数 f(x)={0,Y≠f(x...
复制链接

扫一扫

专栏目录