MLY -- 14.Evaluating multiple ideas in parallel during error analysis

你的团队有提高猫检测器的几个点子:

  • 解决狗被分类为猫的问题
  • 解决“大猫”(狮子,豹等)被认为是家猫(宠物)的问题
  • 提高系统在模糊图像上的性能
  • ……

你可以并行地评估所有这些点子。我通常创建一个电子表格,并在查看这100张误分类开发集图片时填写这张表格,并记下有助于我记起具体是哪个例子的评论。下面用四个图片来演示我是怎么做的:

imagedoggreat catblurrycomments
1不平常的斗牛犬颜色
2
3狮子;雨天在动物园拍摄的照片
4树后面的豹
% of total25%50%50%

上面的图片3既是大猫又是模糊图片:一个例子可以属于多种类别。这就是为什么表格底部的百分数加起来不等于100%的原因。
虽然在上述描述过程中,我首先确定类别(狗,大猫,模糊图片),然后将误分类图片分到每个类别中,在实际中,一旦你开始查看那些抽取的误分类图片,你可能会被启发从而提出新的类别。例如,你在查看了十几个图片后,意识到很多误分类图片是被Instagram过滤器预处理过后的图片。此时,你就可以在电子表格上加上Instagram一栏了。人工查看误分类图片,并在查看时问问自己如何/是否能够给出这些图片的正确标签,将能启发你提出新的错误类别和解决方案。
最有用的错误类别是针对它你已有了提升方案的类别。例如,Instagram类别将是最有用的,如果你有了一个“撤销”Instagram过滤器从而将图片恢复到原始图片的方法。但你不必纠结于已经有了改进想法的错误类别;错误分析阶段的目标是建立你关于“哪个领域是最有前途的、最值得关注的”的直觉。
错误分析是一个迭代过程。你可以从没有任何类别开始。通过查看图像,你可能会想出一些关于错误类别的ideas。然后,在对一些图片手工分类后,你可能会受到启发并提出新的类别,然后返回按照新类别重新检查图片,重复此循环。
假设你完成了100个误分类开发集图片的错误分析,并得到:

imagedoggreat catblurrycomments
1不平常的斗牛犬颜色
2
3&radic狮子;雨天在动物园拍摄的图片
4树后面的豹
% of total8%43%61%

你现在知道了强调消除狗狗错误的项目最多只能消除8%的错误,致力于消除大猫和模糊图片的错误能够提高更多。你可以致力于后两个类别之一。如果你的团队有足够的人,可同时追求多个方向,你可以要求一些工程师致力于大猫和模糊图片两个类别。
错误分析不会产生一个刚性(rigid)的数学公式,告诉你哪个任务应该是优先级最高的。你还必须考虑你希望在不同类别上取得多少进展,以及处理每个类别所需的工作量。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值