阅读Pascal VOC challenge的笔记

前述

最近阅读了一篇Passcal VOC 挑战的论文,论文的发表日期在07年左右,文章在十几年前,对挑战中的数据集处理方法、验证方法、提交方法、处理流程的方法(分类、检测、图像分割、人体layerout的不同处理方法)以及对图像处理上的总结与展望等等等做了详细的论述。

部分观点,在十几年后的现在看来,有的被淘汰、有的在现在仍然具有一定的启发性。

阅读记录如下。

阅读记录

1.物体大小于AP存在一定的正相关。
2.检测图像的外观和高度比等姿态可以在一定程度上,对检测的期望产生比较大的影响
3.在图像精度不是很高的情况下,recall变化会显著影响精度。
4.(这两种方法在阈值为50%时的AP差异仅为0.7%)。我们的结论是,阈值50%的设定是比较合适的,因为捕获的比例的目标检测没有过度惩罚不精确的边界盒预测。
5.检测中,每个方法都提供一个由置信度输出顺序排列的边界框(bounding boxs)列表
6.在检验结果中,为了实现数据的各种在假阳性情况下的分析,在验证中,我们需要有选择的选择验证结果的实际情况。
7.空间信息金字塔表示可能会混淆一些相同纹理的图片。
8.这两种方法剩下的高排位假阳性是很难解释的,主要包括高度杂乱的场景,几乎没有可识别的结构。
9.在检测中,不同的检测方法对物体大小的检测有不同的偏好。通过调整测试过中较低大小的阈值,大多数方法的AP不会增加,这表明,一定要求下,大多数方法对物体对象的偏好有限(或相反?)
10.有三种方法显示对象大小与AP之间存在显著相关性:MPI-Center、MPI-ESSOL和Oxford。MPI-Center方法输出一个固定的边界框,其面积为图像的51%,置信度由全局图像分类器确定。这显然会使结果偏向于图像,其中图像的大部分被感兴趣的对象覆盖,而一个有趣的基线(如预期的那样)并不是一个成功的策略,因为数据集中的许多对象都很小。MPI-ESSOL方法有两个方面可能会使其偏向于较大的对象:(i)它结合了一个整体图像分类器和滑动窗口检测器来对检测进行评分;(ii)它在对象大小上加入了对数高斯先验,并按最大似然法拟合训练数据,该先验可能会对大对象产生偏差。Oxford方法依靠尺度不变的兴趣点算子来提供候选检测,而小目标上缺少兴趣点可以解释其准确性与目标大小之间的相关性。
11.挑战的难度太高会模糊未来发展路向。
12.相比之下,性能“饱和”的数据集很可能鼓励对实现细节进行微调,而不是取得进展,并且大多数进展可能无法衡量,被淹没在噪声之中。
13.鼓励方法的多样性和开发更有力的方法来解决这些要求更高的任务。例如,分割竞争不仅要求比检测任务更精确的目标定位,而且还允许使用基于检测或基于分割的方法。希望这两种方法是互补的,因此检测方法可以用来提高分割性能,反之亦然。在分类和检测任务之间已经出现了类似的情况,即全局图像分类有助于检测性能(见第5.2节),这证明了这种观点。通过鼓励参与者融合不同方法的优点,来提出新的方法。
14.不可避免的是,任何挑战在很大程度上都是在测试由当前的方法和硬件控制的、当前的prac- tiagents能够想到的东西,并且在一定程度上没有意识到这些限制。通过使用品尝者比赛,VOC挑战正在更新,允许更广泛的方法和解决更多当前的研究问题。然而,我们认识到,这项挑战必须继续适应,并保持灵活回应日益增长的使用数据集和参加比赛的研究人员的需求和关注。
15.在类的数量开始不断变多的时候,可以尝试引入类之间共享特征等开发方案来进行解决。

后述

简单记录学习,如有问题欢迎指正。

文章连接

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.157.5766&rep=rep1&type=pdf

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值