推广性的界

最新推荐文章于 2024-04-24 10:48:57 发布

ChenLee_1

最新推荐文章于 2024-04-24 10:48:57 发布

阅读量4.6k

点赞数 1

分类专栏： CV相关文章标签：数据分析网络算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/carson2005/article/details/6453217

版权

CV相关专栏收录该内容

281 篇文章 58 订阅

订阅专栏

统计学习理论中关于经验风险与实际风险之间的重要结论，称之为推广性的界。显然，在观测数据的先验概率和类条件概率都无法准确获得的情况下，推广性的界对于学习机器的性能有着至关重要的影响。

研究人员通过对大量的数据分析发现在经验风险最小化原则下的学习机器的期望风险实际上由两部分组成的，可以简单的表示为如下的形式：

上式中的第一部分是经验风险，第二部分我们称之为置信范围（或VC置信度）。置信界限是期望风险与经验风险差值的上界，它反映了模型复杂性与样本复杂性对泛化能力的影响。

进一步分析我们发现，当n/h较小时，置信范围就较大，用经验风险近似真实风险就有较大的误差，用经验风险最小化取得的最优解可能具有较差的推广性；如果样本数目较多，n/h较大，则置信范围就会很小，经验风险最凶啊花的最优解就接近真实的最优解。

另一方面，对于一个特定的问题，其样本数n是固定的，此时学习机器的VC维（即复杂性越高）越高，置信范围越大，导致真实风险与期望风险之间可能的差就越大，因此，在设计分类器时，我们不但要使经验风险最小化，还要使得VC维尽量小，从而缩小置信范围，使得期望风险最小。这也是为什么一般情况下选用过于复杂的分类器或神经网络往往得不到好的效果的原因。神经网络等方法之所以会出现过学习的情况，就是因为在有限样本情况下，如果网络或算法的设计不合理，就会导致虽然经验风险较小，但置信范围会很大，导致推广能力下降。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
推广性的界

统计学习理论中关于经验风险与实际风险之间的重要结论，称之为推广性的界。显然，在观测数据的先验概率和类条件概率都无法准确获得的情况下，推广性的界对于学习机器的性能有着至关重要的影响。研究人员通过对大量的数据分析发现在经验风险最小化原则下的学习机器的期望风险实际上由两部分
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。