结构化机器学习项目（二）- 机器学习策略(2)

最新推荐文章于 2024-08-05 10:37:11 发布

997and

最新推荐文章于 2024-08-05 10:37:11 发布

阅读量429

点赞数

分类专栏：深度学习文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zxq997997/article/details/125065717

版权

本文探讨了深度学习中的关键实践策略，包括误差分析、清理错误标注数据、快速迭代、处理数据分布不匹配、迁移学习、多任务学习、端到端深度学习的适用场景及其优缺点。强调了在训练和测试数据分布不同情况下，如何调整算法，以及在数据不足时利用迁移学习提升性能。同时，提到了在某些任务中，多任务学习和端到端学习的有效性。

摘要由CSDN通过智能技术生成

本次学习笔记主要记录学习深度学习时的各种记录，包括吴恩达老师视频学习、花书。作者能力有限，如有错误等，望联系修改，非常感谢！

@[TOC](结构化机器学习项目（二）- 机器学习策略(2))

第一版 2022-06-01 初稿

一、进行误差分析(Carrying out error analysis)

在这里插入图片描述
调试猫分类器，90％准确率。
如图将两只狗误分析，可以针对狗，收集更多狗图或设计处理狗的算法

建议做的：
首先，收集一下，如100个错误样本，手动检查。机器学习中加人为数据不太好。
在这里插入图片描述
有时在做错误分析时，可以同时并行评估几个想法。标记错误，做到一半时可能发现滤镜干扰了分类器。

二、清除标注错误的数据(Cleaning up Incorrectly labeled data)

在这里插入图片描述
如图，倒数第二个被标记错误。
深度学习算法对于训练集中的随机错误是相当健壮的（robust），但对系统性的错误没那么健壮。

是否值得修正6％标记出错的样本。

首先，不管用什么修正手段，都要同时作用到开发集和测试集上，他两必须来自同一分布。
其次，考虑同时检验算法判断正确和判读错误的样本，
最后，可能决定只修正开发集和测试集，它们相较较小。

三、快速搭建你的第一个系统，并进行迭代(Build your first system quickly,then iterate)

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
结构化机器学习项目（二）- 机器学习策略(2)

深度学习笔记
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。