machine learning可行性数学原理论证篇(一)

本文探讨了在机器学习中,当hypothesis集合有限时,如何利用概率论中的原理来推断并选择最佳hypothesis。通过hoeffding公式,证明在大多数情况下,抽样样本的表现可代表整体样本空间。机器学习的目标是找到使得Ein(h)最小的hypothesis,以确保训练集上的性能能够泛化到整个样本空间。
摘要由CSDN通过智能技术生成

一、hypothesis set 有限个数时,machine learning 靠谱吗
样本空间的target函数我们是不知道的!凭什么说学习到的规则就可以表示样本空间的规则?
但是在概率论中,我们有一条原理是说,利用已知的概率可以大概推断出未知的概率。所以我们就思考啊,能否利用hypothesis在抽样样本的表现来推断出这个hypothesis 在样本空间上的表现,进而选出最好的hypothesis。顺着思路,我们具体来看看数学上的证明。

主要利用的概率论公式,利用已知推断未知:
在这里插入图片描述联系机器学习过程,针对一个给定的hypothesis ,我们可以认为u是在整个样本空间上hypothesis 函数的表现(误分率),v是在抽样空间上hypothesis 表现(误分率),根据hoeffding公式,我们可以认为u和v大概率差不多是相等的。具体来说,大概率表示说随机在样本空间上进行抽样(保证样本空间足够大),绝大多数情况下,得到的这些抽样样本的表现都是可以表明整个样本空间上的表现,只有极少极少的情况下,抽样样本的表现和样本空间的表现相差甚远(正是由于这点 会影响在多个hypothesis set里选择g时 产生新的问题)。而差不多表明,u和v不可能完全相等,存在着可包容的误差。
在这里插入图片描述<

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值