本次学习笔记主要记录学习深度学习时的各种记录,包括吴恩达老师视频学习、花书。作者能力有限,如有错误等,望联系修改,非常感谢!
@[TOC](结构化机器学习项目(二)- 机器学习策略(2))
第一版 2022-06-01 初稿
一、进行误差分析(Carrying out error analysis)
调试猫分类器,90%准确率。
如图将两只狗误分析,可以针对狗,收集更多狗图或设计处理狗的算法
建议做的:
首先,收集一下,如100个错误样本,手动检查。机器学习中加人为数据不太好。
有时在做错误分析时,可以同时并行评估几个想法。标记错误,做到一半时可能发现滤镜干扰了分类器。
二、清除标注错误的数据(Cleaning up Incorrectly labeled data)
如图,倒数第二个被标记错误。
深度学习算法对于训练集中的随机错误是相当健壮的(robust),但对系统性的错误没那么健壮。
是否值得修正6%标记出错的样本。
首先,不管用什么修正手段,都要同时作用到开发集和测试集上,他两必须来自同一分布。
其次,考虑同时检验算法判断正确和判读错误的样本,
最后,可能决定只修正开发集和测试集,它们相较较小。