Takeaways: Setting up development and test sets 小结:建立开发集和测试集(吴恩达《MACHINE LEARNING YEARNING》)

建立开发集和测试集

  1. 从分布中选择开发集和测试集,以反映你期望在未来获得的数据,并希望在上面做得很好。这可能和你的训练数据分布不同。
  2. 如果可能的话,选择来自同一分布的开发集和测试集。
  3. 为你的团队选择单一数字的评估指标进行优化。如果你关心多个目标,请考虑把它们合并到一个公式中(例如平均多个错误指标),或设定满足指标和优化指标。
  4. 机器学习是一个高度迭代的过程:在发现你满意的方法之前你可能需要尝试很多的idea。
  5. 具有开发/测试集和单一数字评估指标可以帮助你快速评估算法,因此迭代地更快。
  6. 当开始一个全新的应用时,尝试快速建立开发/测试集和评估指标,最好在一周之内。当然,在成熟的应用程序上花费更长的时间也是ok的。
  7. 依据70%:30%的比例划分训练/测试集这一经验性的方法不太适用于你拥有大量数据的情况;开发/测试集可以占有远小于30%的数据量。
  8. 你的开发集数据量应足够大,大到能检测出你的算法准确性上的有意义的改变,但没必要更大。你的测试集应该足够大,大到能对你的系统整体性能评估拥有一个很高的自信度。
  9. 如果你的开发集和评估指标不再使你的团队在正确方向上前进,快速改变它:(i)如果你过拟合了开发集,去获得更多的开发集数据。(ii)如果你所关心的实际分布和开发/测试集 的分布不同,那么得到新的开发/测试集 数据。(iii)如果你的评估指标不再能衡量对你来说最重要的东西,请改变评估指标。
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值