机器学习中样本的样本量的估计

UESTC_C2_403

于 2017-06-04 15:06:53 发布

阅读量1.4w

点赞数 3

分类专栏：机器学习--ML

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/UESTC_C2_403/article/details/72859021

版权

机器学习中，样本量不足可能导致学习到的规则错误。通过Hoeffding不等式可以估计样本量，通常样本数量约等于10倍的VC维。深度学习的VC维高，表示其表达能力强，但也需要大量样本防止过拟合。现代深度学习通过模型结构优化和正则化降低了VC维，同时增加训练数据量和使用数据增强等方法提升泛化能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在机器学习中，如果样本量不足，我们利用模型学习到的结果就有可能是错误的，因为样本不足的情况下，规则会有很多。也就是我们如果用f表示真是的规则，用g表示利用模型学习到的规则。那么我们希望g和f越接近越好，可是我们并不知道f到底是什么？如果样本不足，机器是没法学习的。

例如：

给你123，输出为246。有人会说那就是对应元素乘以2，这是一种规则。还有别的规则，第一个数字是原来数的第二位，后面两位分别是原来数字后两位乘以2.还有很多别的规则，规则不唯一，学习就会失效，我们可以利用hoeffding inequality不等式来估计一下学习到的g和f很接近的概率有多大。

Ein就是采用g假设时候误差，Eout就是采用f时候的误差。从这个不等式可以知道，样本越大，得到g和f接近的概率就越大，样本越小，就越小。可以用这个公式大概计算一下样本的数量。dvc也是一个重要的参数，也不能太大，如果太大，样本就需要更多。

一般情况下，样本数量大约等于10dvc就可以了，但是上面的公式计算的结果就会大很多。

dvc就是表示VC dimension。感知机算法的dvc等于d+1，d就是数据的维度。

最低0.47元/天解锁文章

博客等级

码龄9年

139
原创

567
点赞

744
收藏

460
粉丝

关注

私信

热门文章

分类专栏

最新评论

矩阵求逆引理(matrix inversion lemma)
weixin_47028382: 舒尔补，两行证出。
参数(parameters)和超参数(hyperparameters)
天晴虹至: 学习速率，迭代次数，层数，每层神经元的个数这四个超参数在对抗生成网络GAN有吗
tensorflow让彩色图变成灰度图
想要成为一个合格的码农: 如果是未解压的压缩包该怎么处理呢
峭度度量非高斯分布的理论知识
--有没有盒纸: 求救！请问kurt(y)有峭度之外的其他学名吗？在其他帖子上搜到的峭度公式跟您博客中的公式不同；还有公式中的y是代表什么呢？期望是怎么求的？
tf.nn.embedding_lookup函数的用法
weixin_49959093: 那么在真实的环境中，tf.nn.embedding_lookup（prams,ids）,id是真实的itemid,例如44333567，而不是，0，1，2，3这种，又如何使用呢？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。