吴恩达machine learning yearning读书笔记1

最新推荐文章于 2021-07-12 14:09:13 发布

guanguanboy

最新推荐文章于 2021-07-12 14:09:13 发布

阅读量137

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guanguanboy/article/details/103378067

版权

机器学习专栏收录该内容

16 篇文章 0 订阅

订阅专栏

在《setting up development set and test set》这一章中，作者提到了一个很重要的问题。

训练集和测试集分布不一致导致的机器学习模型泛化能力有限：在训练集上表现比较好，但是在不同分布的测试集上表现很糟糕这个话题。

比如作者提到一个例子，猫咪探测器，训练的时候用的从website download的猫咪图片，但是测试的时候用的是通过手机拍照得到的猫咪图片，由于分布不一致，导致实际应用的时候效果很差。

如何解决这个问题呢：

在训练的时候就使用手机拍摄的照片来进行训练，主要用在dev sets（验证集）中。这样可以确保训练集和测试集有相同的分布，这样模型就会有比较好的泛化能力。

如果实在找不到手机拍摄的照片来进行训练，你需要认知到模型可能存在泛化能力不足的问题。

另一个问题是这样的，如果训练集和测试集来自于同一个分布，但是结果依然是在模型在训练集上有非常好的表现，但是在测试机上表现不好。

遇到这个问题的时候，一个非常清晰的思路就是，you have overfit the dev set。在训练集上过拟合了。

遇到这个问题，可能发生了一下事情：

1，过拟合

2.测试集的数据比训练集的数据harder，更难分类，更复杂。

3，测试集不是更harder，而是与训练集的数据不同。在这种情况下，一味的提高训练集的准确率是徒劳的。

It is an important research problem to develop
learning algorithms that are trained on one distribution and generalize well to another. But if
your goal is to make progress on a specific machine learning application rather than make
research progress, I recommend trying to choose dev and test sets that are drawn from the
same distribution. This will make your team more efficient.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

guanguanboy CSDN认证博客专家 CSDN认证企业博客

码龄17年

249: 原创

3万+: 周排名

144万+: 总排名

102万+: 访问

: 等级

9878: 积分

68: 粉丝

250: 获赞

87: 评论

870: 收藏

私信

关注

热门文章

分类专栏

最新评论

undefined reference to `cv::VideoCapture::VideoCapture()'
CmWill: 对于 VideoCapture 类，至少需要链接到 opencv_core、opencv_imgproc 和 opencv_videoio 库。
Microsoft Visual C++ Runtime Library的Debug Assertion Failed中包含的信息
Isis_ss: 该怎么改呢
Microsoft Visual C++ Runtime Library的Debug Assertion Failed中包含的信息
Isis_ss: 请问解决了吗 Microsoft Visual C ++ Runtime Library Debug Assertion Failed ! Program D :AORBSLAM24Windows- master \ Examples \ RGB - D \ Release \ rgbd tum . e Xe File : minkernel crts \ ucrt \ src \ appcrt \ lowio \ read . cpp Line :381 Expression :_ osfile ( fh )& FOPEN For information on how your program can cause an assertion failure , see the Visual C ++ documentation on asserts . ( Press Retry to debug the application )
AttributeError: ‘Tensor‘ object has no attribute ‘_keras_shape‘
ROllan_104: 感谢，解决了
pip安装mxnet失败
people_paper: 我为什么我报错好几大页呀 uang\vs_ide\VC\Tools\MSVC\14.29.30133\include -IC:\Program Files (x86)\Windows Kits\NETFXSDK\4.8\include\um -ID:\Windows Kits\10\include\10.0.19041.0\ucrt -ID:\Windows Kits\10\include\10.0.19041.0\shared -ID:\Windows Kits\10\include\10.0.19041.0\um -ID:\Windows Kits\10\include\10.0.19041.0\winrt -ID:\Windows Kits\10\include\10.0.19041.0\cppwinrt -ID:\vs2019_ruang\vs_ide\VC\Tools\MSVC\14.29.30133\ATLMFC\include -ID:\vs2019_ruang\vs_ide\VC\Tools\MSVC\14.29.30133\include -IC:\Program Files (x86)\Windows Kits\NETFXSDK\4.8\include\um -ID:\Windows Kits\10\include\10.0.19041.0\ucrt -ID:\Windows Kits\10\include\10.0.19041.0\shared -ID:\Windows Kits\10\include\10.0.19041.0\um -ID:\Windows Kits\10\include\10.0.19041.0\winrt -ID:\Windows Kits\10\include\10.0.19041.0\cppwinrt -ID:\vs2019_ruang\vs_ide\VC\Tools\MSVC\14.29.30133\ATLMFC\include -ID:\vs2019_ruang\vs_ide\VC\Tools\MSVC\14.29.30133\include -IC:\Program Files (x86)\Windows Kits\NETFXSDK\4.8\include\um -ID:\Windows Kits\10\incl

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。