《Machine Learning Yearning》第7章

这一章主要内容:
1.样本数量适中(100-1000)时,开发集/测试集的比例为7:3比较合理。
2.数量很大时,这个比例需要改变。所需的精度越高,样本数量应该更大。

7 How large do the dev/test sets need to be?

 开发集要足够大才能检测你所尝试的算法之间的差异。例如,如果分类器A有90%的准确率,B有90.1%,那么有100个样本的开发集就无法判断这0.1%的差别。相比较我见过的机器学习问题,100个样本的开发集是很小的,1000-10000的样本比较常见。如果有10000个样本,你就有可能发现这0.1%的的提升 1 1

 对于成熟和重要的应用—例如,广告、网页搜索和产品推荐。我也见过有的团队会为了0.01%的提升而努力,因为这直接影响了这个公司的收益。在这种情况下,为了获取更小的提升,数据集甚至超过10000。

 测试集应该要多大呢?它应该有足够大,能对系统的整体性能有很高的置信度。一种流行的方式就将你的30%数据用于测试集。当你的样本数量适中(100-1000)的时候,这个比例会有用。但是现在是大数据时代,我们的机器学习问题有时会超过10亿的样本,分配给开发/测试集的部分一直在缩小,即使开发/测试的绝对数量在增加。除了评估你的算法性能所需的数据以外,就没有必要浪费大量的开发/测试数据。

1 1 从理论上讲,可以测试算法的变化是否会对开发集产生统计上的显著差异。在实践中,大部分团队不会在意这个(除非他们准备发表学术研究论文),而且我通常没有发现统计显著性测试对衡量临时进展有用。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值