18.人工观测数据集和模型调参数据集多大合适翻译自吴恩达新书-Machine Learning Yearning

最新推荐文章于 2022-12-18 21:48:53 发布

maerdym

最新推荐文章于 2022-12-18 21:48:53 发布

阅读量527

点赞数

分类专栏：吴恩达-YEARNING 文章标签：吴恩达新书中文版吴恩达新书 Machine Learning Yearning 中文版吴恩达新书中文版全吴恩达新书中文版全（1-52章）

吴恩达-YEARNING 专栏收录该内容

54 篇文章 3 订阅

订阅专栏

更多好玩的机器学习教程: 进入袋马学院领一份，全部免费?.

人眼观察
人工观测数据集应该设置的足够大，这样方便你找到主要的错误类别。如果你在一项工作，这项工作人类可以完成的很好(比如识别图片中的猫)，这有些粗略的指导准则：

• 如果在人类观测数据集上只产生了10个错误，则这个错误的数量太少了，用这10个错误，很难精确评估出不同类别错误的影响。但是如果数据量本身就比较少，而且无法投入更多的成本在人工观测数据集上，那么有总比没有好，这10个错误，也可以帮助你划分工作的优先级。

• 如果你的分类器在人工观测数据集上产生了20个错误，那么你就可以粗略的估计错误的来源了。

• 如果产生了50个错误，那么你就可以很好的找到错误的来源了。

• 如果产生了100个错误，那么你就可以更好的理解错误的来源。据我所知，人们往往会手工分析更多的错误，有时会多大500个。当你有足够多的数据时，这时一个不错的选择，这么做只有好处没有坏处。

如果说你的分类器有5%的错误率，为了在人工观测样本集上找到100个错误样本，你需要在人工观测样本集中放置2000个样本(因为0.05*2000=10)。为了得到足够多的错误样本，分类器的错误率越低，仍共观测的数据集就要越大。

如果你在做一项人类无法很好完成的工作，这时在人工观测样本集上做实验作用就没那么大了。因为人类很难分辨错误分类的原因。这种情况下，你可以忽略人工观测样本集。

我们将在后面的章节，讨论这些问题的处理准则。
黑盒数据集
模型调参(黑盒)数据集, 我们之前说过开发数据集中通常包含1000到10,000个样本。经过更多的数据也没什么坏处，但1000到10,000个样本的模型调参数据集完全足够我们进行参数调优和模型选择了。用于100个样本的模型调参数据集可能有些小，但是以然可用。

如果你的开发数据集比较小，可能没法无法将其分割成两个数据集，以满足手工调测数据集和模型调参数据集的需求。此时，你可以将所有的数据都用做人工调测数据集，这时你需要手工处理所有的开发数据集样本。

在人工调测数据集和模型调测数据集中，我认为人工调测数据集更加重要一些(假设你在处理一个人类能很好完成的工作，通过实验可以让你更加清楚的看成问题所在)，如果你只有人工观测数据集，那么你可以在这个数据集上进行误差分析、模型选择、参数调优。只有人工调测数据集的缺点是更容易产生过拟合的现象。

如果你有足够多的数据，那么人工观测数据集的大小取决于你有多少时间来进行手工分析。例如，我很少看到有人手工分析1000个以上的错误数据。

更多好玩的机器学习教程: 进入袋马学院领一份，全部免费?.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

maerdym CSDN认证博客专家 CSDN认证企业博客

码龄13年

53: 原创

6万+: 周排名

76万+: 总排名

31万+: 访问

: 等级

3669: 积分

307: 粉丝

151: 获赞

234: 评论

529: 收藏

私信

关注

热门文章

分类专栏

最新评论

YOLO7环境搭建、代码测试
Carbonyl_Weng: 我想问一下，如果要在已经配置好的虚拟环境中搭建，要怎么弄呢，安装依赖库的时候（pip install -r requirements.txt），一直都是显示ERROR: Could not open requirements file: [Errno 2] No such file or directory: 'requirements.txt'，是应该把源码放到哪个文件夹呢
YOLO7环境搭建、代码测试
JH_JYS: Traceback (most recent call last): File "detect.py", line 10, in <module> from models.experimental import attempt_load File "/root/autodl-tmp/models/experimental.py", line 6, in <module> from models.common import Conv, DWConv File "/root/autodl-tmp/models/common.py", line 15, in <module> from utils.datasets import letterbox ModuleNotFoundError: No module named 'utils.datasets' 请问这个问题该怎么解决呢
YOLO7环境搭建、代码测试
普通网友: 博主，，test.py上面的导包出现问题呀，，根本不能导包，，这是为什么呀
YOLO7环境搭建、代码测试
乌拉的啦: 是不是图片放错位置了？
YOLO7 姿势识别实例
有闲的小孩新子: 图片没什么问题，但是出现这种错误，不知何故啊RuntimeError: Sizes of tensors must match except in dimension 1. Expected size 13 but got size 14 for tensor number 1 in the list.

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。