论文阅读005-目标识别综述-Object Detection in 20 Years: A Survey

最新推荐文章于 2024-07-27 16:07:02 发布

半夜萤火虫

最新推荐文章于 2024-07-27 16:07:02 发布

阅读量874

点赞数

分类专栏：计算机视觉文章标签：目标识别 object detection 计算机视觉综述

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/OTime77/article/details/95474859

版权

计算机视觉专栏收录该内容

15 篇文章 0 订阅

订阅专栏

这篇综述的v2版本比较新，是2019年5月发的，总结了近20年来目标识别的主要方法、技术演进和未来发展。读完可以算是对这个方向有了一个大概的了解。
文章地址： https://arxiv.org/abs/1905.05055

什么是目标识别(object detection)？

目标识别就是通过计算机建立一个模型来识别图片中物体的位置和类别。

目标识别主要模型演进

在这里插入图片描述
这张图很好地展示了目标识别这20年来的技术演进。所以要入门这个方向，这些重点论文可以读一读。该图有2个重点：

1、2012年前以传统方法为主， 2012年后以深度学习方法为主，可想而知是因为2012的AlexNet论文的发表

2、深度学习方法以one-stage和two-stage方法为主。就按字面意思理解，one-stage是以一步到位的方式找到物体位置和类别，而two-stage则是由粗到细。

在这里插入图片描述
自2012年后，基于深度学习的模型准确度上升速度很快。所以现在这个方向的发展基本是以深度为主了。

数据集介绍

经典目标识别数据集

在这里插入图片描述

路人检测数据集

在这里插入图片描述

人脸识别数据集

在这里插入图片描述

文本识别数据集

在这里插入图片描述

交通灯和交通符号识别

在这里插入图片描述

远距离

在这里插入图片描述

目标识别相关技术

如何评价一个识别器效果？

1、mean Average Precision (mAP)

AP即数据集中一个类别的平均准确度，mAP即数据集中所有类别的平均准确度。

2、the Intersection over Union (IoU)

中文翻译为“交并比”，也就是预测物体边界框占比实际物体边界框大小。
注：这些概念可以在卷积神经网络-计算机视觉章by吴恩达中看到，讲了很多先今计算机视觉领域流行的技术。

3、localization recall precision

“本地回调准确度”，这个算是新起之秀，不过还是前2种比较主流。

物体特征提取

物体特征提取的方式在这20年来有了很大变化。简要说下：

1、传统时代中的the Haar wavelet

优点：计算效率高

2、深度时代中的前向传播就能提取物体特征

多尺度检测的发展

在这里插入图片描述

边界框的发展

在这里插入图片描述

context priming的发展

在这里插入图片描述

非极大值抑制的发展(non-max suppresion)

在这里插入图片描述

难例挖掘的发展(hard negative mining)

在这里插入图片描述
什么是难例，有3种类型，可见下图

目标识别加速

在这里插入图片描述
作者在文章里写了很多内容。大致可以分为以下几种方法：

1、feature map共享计算

2、分类器加速

3、串联结构加速

4、网络修剪和网络量化

5、设计轻量级网络

————————————————————
方法有5个：

1、分解卷积，比如使用流行的1x1卷积核

2、群卷积(group convolution)，比如使用流行的1x1卷积核

3、深度可分离卷积(depth-wise separable convolution)

4、设计瓶颈结构（bottle-neck)

5、神经网络架构搜索（neural architecture search)

————————————————————

6、数值加速

最近的新发展、挑战和总结

最近的新发展、挑战和总结作者在文中详细介绍，因为自己对这一方面还不太了解没法很好地总结概括，具体内容请看文章4、5、6节。

半夜萤火虫

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

半夜萤火虫 CSDN认证博客专家 CSDN认证企业博客

码龄8年

17: 原创

29万+: 周排名

178万+: 总排名

1万+: 访问

: 等级

316: 积分

1: 粉丝

6: 获赞

10: 评论

61: 收藏

私信

关注

热门文章

分类专栏

最新评论

使用pytorch进行迁移学习修改预训练权重模型的分类层/输出类别（附mmaction相关实现代码）
weixin_44298038: i3dhead不是直接能改吗
使用pytorch进行迁移学习修改预训练权重模型的分类层/输出类别（附mmaction相关实现代码）
Ashleyyyi: [code=python] File "/home/wh2/PREN/train.py", line 53, in __init__ self.model.load_state_dict(ckpt['state_dict'], strict=False) File "/home/wh2/miniconda3/envs/pren/lib/python3.7/site-packages/torch/nn/modules/module.py", line 830, in load_state_dict self.__class__.__name__, "\n\t".join(error_msgs))) RuntimeError: Error(s) in loading state_dict for Model: size mismatch for linear.weight: copying a param with shape torch.Size([113, 384]) from checkpoint, the shape in current model is torch.Size([413, 384]). size mismatch for linear.bias: copying a param with shape torch.Size([113]) from checkpoint, the shape in current model is torch.Size([413]). Process finished with exit code 1 [/code] 您好我这个修改以后还是会报错请问是为什么呀
mac+Xcode+opencv+ c++环境配置
Tisfy: 十分完美，正如：寄书长不达，况乃未休兵。
TPN中的resnet源码阅读笔记
半夜萤火虫: TPN这份代码没有跑
TPN中的resnet源码阅读笔记
IC解惑君: 请问博主把这篇论文得代码跑通了吗？可以分享一下吗？非常感谢

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。