吴恩达神经网络和深度学习-学习笔记-20-训练/开发/测试集划分

最新推荐文章于 2022-08-30 18:47:17 发布

Harry嗷

最新推荐文章于 2022-08-30 18:47:17 发布

阅读量590

点赞数 1

分类专栏：吴恩达神经网络和深度学习-学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41683065/article/details/96483647

版权

吴恩达神经网络和深度学习-学习笔记专栏收录该内容

46 篇文章 22 订阅

订阅专栏

设计开发集（dev set）和测试集（test set）

机器学习中的工作流程是：

尝试很多思路，用训练集训练不同的模型。
使用开发集来评估不同的思路，选择一个然后不断迭代去改善开发集的性能。
得到一个令人满意的成本，再用测试集去评估。

我们需要使得测试集（test set）和开发集（dev set）的数据同分布。
在这里插入图片描述
一个Guideline：

简单来说，就是测试集和开发集的数据应该与我最后实际应用的数据一致，而测试集和开发集这二者本身应该同分布。
否则，在开发集上优化好的模型，并不能用于测试集。

这节课的重点在于：设立开发集和评估指标，真的就定义了模型所要瞄准的目标。所以开发集和训练集必须为同分布。

而设立训练集的方式，则会影响你逼近那个目标有多快。
在这里插入图片描述

开发集（dev set）和测试集（test set）的大小

在这里插入图片描述
在面对少量数据100、1000、10000时，按照上面的分类方式更好。
在面对大量数据如1000000时，下面的划分方式更合理。

对于test set来说：
在这里插入图片描述
令测试集足够大，以能够高置信度地评估系统整体性能。

P.S.
对于某些应用，也许不需要对系统性能有置信度很高的评估。在这种情况下我们可能只需要训练集（training set）和开发集（dev set），即不单独分出一个测试集也是可以的（and acknowledge that you don’t have a test set）。
当然吴恩达老师绝对不建议在搭建系统的时候省略测试集（test set），因为有个单独的测试集使我安心。因为你可以用这组不带偏差的数据来测试系统的性能。
如果你的开发集很大，这样你就不会对开发集拟合得太厉害，在这种情况下，只有训练集和开发集也不是完全不合理。
在这里插入图片描述

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
吴恩达神经网络和深度学习-学习笔记-20-训练/开发/测试集划分

设计开发集（dev set）和测试集（test set）机器学习中的工作流程是：尝试很多思路，用训练集训练不同的模型。使用开发集来评估不同的思路，选择一个然后不断迭代去改善开发集的性能。得到一个令人满意的成本，再用测试集去评估。我们需要使得测试集（test set）和开发集（dev set）的数据同分布。一个Guideline：简单来说，就是测试集和开发集的数据应该与我最后实...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。