深度学习笔记(3):2.1-2.3 误差分析(error analysis)

本文介绍了深度学习中的误差分析,用于评估模型性能和决定优化方向。通过分析错误案例,可以决定是否处理特定问题,如狗的分类错误,以了解性能上限。同时,探讨了错误标注数据的修正,强调了开发集和测试集的同分布重要性。最后,提倡快速构建初步系统并迭代,以便于进行偏差和方差分析,找到改进模型的有效途径。
摘要由CSDN通过智能技术生成

2.1 进行误差分析(carrying out error analysis)

这一小节我们学习用误差分析来评估某个想法执行的价值。

当我们的算法还未达到人类水平时,人工检查一下算法所犯的错误也许可以让你了解接下来干什么,举个例子,如下图所示:

假设猫分类器准确率为90%,误差为10%,在错误分类的例子中我们发现有上图中的两类狗图片(乍一看觉得是猫),为了让你的猫分类器在狗图上做得更好,你可能会设计一些狗的特有特征,或收集更多关于狗的图片去提高模型性能,但现在问题是需不需要做一个项目专门处理狗的问题,因为这样做可能会花费好几个月,但收效甚微。这样做值得吗?

现在有误差分析(error analysis)这一方法可以让你快速知道这样做到底值不值得。误差分析怎么做呢?

首先,我们需要从开发集或测试集中分错的例子中随机抽取100个,然后数一下分错的例子中有多少个是狗。假设100个中只有5个是狗但被错分为猫,那么即使全部解决狗的问题,也只能解决5个例子,即即使花费了好几个月全部解决狗的问题,也只是将犯错的概率从10%减少到9.5%,虽然你可能觉得这样花时间不值也可能觉得这样做是值得的,但至少误差分析给了你一个上限,即处理狗问题能够改善的算法性能的上限,我们也称其为性能上限(celing of performance)。

我们知道在机器学习中有些人会很鄙视人工操作或使用太多手工洞察(manual insight),但如果你要搭建应用系统,那这个简单的人工统计步骤误差分析,可以为我们节省大量时间,可以让我们迅速决定什么才是最重要的。误差分析用时不长且能告诉我们这个方向的价值,帮你决定是否把未来几个月的时间都用来解决狗图的问题上。

除了评估一个想法,误差分析也可以同时评估好几个想法,这可以提高我们效率,如下图所示:

比如你有几个改善猫分类器的想法,可以建立电子表格来解决这样一个问题,其中行是图片数目,即你要人工观察的图片个数,而列是你要评估的想法,

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值