结构化机器学习项目(二)- 机器学习策略(2)

本文探讨了深度学习中的关键实践策略,包括误差分析、清理错误标注数据、快速迭代、处理数据分布不匹配、迁移学习、多任务学习、端到端深度学习的适用场景及其优缺点。强调了在训练和测试数据分布不同情况下,如何调整算法,以及在数据不足时利用迁移学习提升性能。同时,提到了在某些任务中,多任务学习和端到端学习的有效性。
摘要由CSDN通过智能技术生成

本次学习笔记主要记录学习深度学习时的各种记录,包括吴恩达老师视频学习、花书。作者能力有限,如有错误等,望联系修改,非常感谢!

@[TOC](结构化机器学习项目(二)- 机器学习策略(2))


第一版       2022-06-01        初稿

一、进行误差分析(Carrying out error analysis)

在这里插入图片描述
调试猫分类器,90%准确率。
如图将两只狗误分析,可以针对狗,收集更多狗图或设计处理狗的算法

建议做的:
首先,收集一下,如100个错误样本,手动检查。机器学习中加人为数据不太好。
在这里插入图片描述
有时在做错误分析时,可以同时并行评估几个想法。标记错误,做到一半时可能发现滤镜干扰了分类器。

二、清除标注错误的数据(Cleaning up Incorrectly labeled data)

在这里插入图片描述
如图,倒数第二个被标记错误。
深度学习算法对于训练集中的随机错误是相当健壮的(robust),但对系统性的错误没那么健壮。
在这里插入图片描述
是否值得修正6%标记出错的样本。
在这里插入图片描述
首先,不管用什么修正手段,都要同时作用到开发集和测试集上,他两必须来自同一分布。
其次,考虑同时检验算法判断正确和判读错误的样本,
最后,可能决定只修正开发集和测试集,它们相较较小。

三、快速搭建你的第一个系统,并进行迭代(Build your first system quickly,then iterate)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值