《图像物体分类与检测算法综述》——黄凯奇、任伟强、谭铁牛的阅读笔记。
一、目的
以此论文建立数字图像处理的总体概念,其中“数字图像处理”的概念有待确认。
二、简述
在摘即使你的话要部分指出图像物体这个主体的两个基本问题就是分类与检测,其次才有分割、跟踪、行为分析等后续操作(在此部分,由于查阅过纺织服装的智能检测的两篇论文,在图像分割后的操作有所差异——为聚类、提取)。
截取文章摘要中所述的整体逻辑为:
- 从实例、类别、语义三个层次对物体分类与检测研究中存在的困难与挑战进行了阐述。
- 该文以物体检测和分类方面的典型数据库和国际视觉算法竞赛PASCAL VOC竞赛为主线对近年来物体分类与检测的发展脉络进行了梳理与总结,指出表达学习和结构学习在于物体分类与检测中占有重要的地位。
- 最后文中对物体分类与检测的发展方向进行了思考和讨论,探讨了图像物体识别中下一步研究可能的方向。
[小标题:图像物体分类与检测概述——物体分类与检测的难点与挑战(实例、类别、语义三个层次)——物体分类与检测数据库——物体分类与检测的发展历程(词包模型、深度学习模型、物体检测方法)——对物体分类与检测的思考(物体检测和物体分类的统一性、物体分类与检测的发展方向、结构化学习存在的难点与挑战、层次化学习即深度学习存在的难点与挑战)——结论]
三、内容和分析
论文中提到计算机视觉理论要解决的基本问题是“什么东西在什么地方”,即分类和检测,分类为确定图像中存在什么物体,检测为确定图像中什么位置存在什么物体。
难点与挑战