machine learning可行性数学原理论证篇（一）

最新推荐文章于 2020-11-01 12:59:04 发布

极致 for 简单

最新推荐文章于 2020-11-01 12:59:04 发布

阅读量177

点赞数

文章标签： machine learning 原理分析

本文链接：https://blog.csdn.net/m0_37937932/article/details/90327870

版权

本文探讨了在机器学习中，当hypothesis集合有限时，如何利用概率论中的原理来推断并选择最佳hypothesis。通过hoeffding公式，证明在大多数情况下，抽样样本的表现可代表整体样本空间。机器学习的目标是找到使得Ein（h）最小的hypothesis，以确保训练集上的性能能够泛化到整个样本空间。

摘要由CSDN通过智能技术生成

一、hypothesis set 有限个数时，machine learning 靠谱吗
样本空间的target函数我们是不知道的！凭什么说学习到的规则就可以表示样本空间的规则？
但是在概率论中，我们有一条原理是说，利用已知的概率可以大概推断出未知的概率。所以我们就思考啊，能否利用hypothesis在抽样样本的表现来推断出这个hypothesis 在样本空间上的表现，进而选出最好的hypothesis。顺着思路，我们具体来看看数学上的证明。

主要利用的概率论公式，利用已知推断未知：
在这里插入图片描述联系机器学习过程，针对一个给定的hypothesis ，我们可以认为u是在整个样本空间上hypothesis 函数的表现（误分率），v是在抽样空间上hypothesis 表现（误分率），根据hoeffding公式，我们可以认为u和v大概率差不多是相等的。具体来说，大概率表示说随机在样本空间上进行抽样（保证样本空间足够大），绝大多数情况下，得到的这些抽样样本的表现都是可以表明整个样本空间上的表现，只有极少极少的情况下，抽样样本的表现和样本空间的表现相差甚远（正是由于这点会影响在多个hypothesis set里选择g时产生新的问题）。而差不多表明，u和v不可能完全相等，存在着可包容的误差。
在这里插入图片描述 <

最低0.47元/天解锁文章

极致 for 简单

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
machine learning可行性数学原理论证篇（一）

一、hypothesis set 有限个数时，machine learning 靠谱吗样本空间的target函数我们是不知道的！凭什么说学习到的规则就可以表示样本空间的规则？但是在概率论中，我们有一条原理是说，利用已知的概率可以大概推断出未知的概率。所以我们就思考啊，能否利用hypothesis在抽样样本的表现来推断出这个hypothesis 在样本空间上的表现，进而选出最好的hypothes...
复制链接

扫一扫