龙源期刊网
http://www.qikan.com.cn
基于特征融合的目标检测算法研究
作者:封靖川
胡小龙
李斌
来源:《数字技术与应用》
2018
年第
12
期
摘要:近年来,深度学习在目标检测领域得到了极大的发展,但在检测精度和速度上仍有
提升空间。本文针对
one-stage
目标检测算法对特征图的信息利用不充分的问题,提出了一种
特征融合的检测模型,将
CNN
低层的物体位置、轮廓信息与高层语义信息融合。实验表明该
模型在支持实时检测的条件下提升了检测精度,具有较大的理论和应用价值。
关键词:深度学习
;
目标检测
;
特征融合
中图分类号:
TP391.41
文献标识码:
A
文章编号:
1007-9416
(
2018
)
12-0114-02
目标检测是计算机视觉领域的一个热门,基础的研究方向,具有重要的理论和应用价值。
其主要任务为找出图像中感兴趣的物体,包含物体定位和识别两个子任务,需要同时确定物体
的位置和类别。
1
国内外研究现状
自从
2012
年
Geoffrey Hinton
教授率领团队采用
AlexNet
在
ImageNet
视觉识别挑战赛上取
得第一名的优异成绩之后,深度学习模型开始广泛应用于计算机视觉的各个研究领域,包括目
标检测,人脸识别,图像分割等等。目前基于深度学习的目标检测算法可以大致分为以下两
类:
1.1
基于
region-proposal
的
two-stage
检测算法
该类算法将目标检测分为两个步骤,首先通过区域建议模型得出目标候选框,然后再通过
CNN
从候选框中提取目标特征,进一步定位目标位置并进行目标分类。代表算法为
R-CNN
和
Faster R-CNN
,
R-CNN
采用选择性搜索(
Selective Search
)的方式提取目标候选框,然后通过
卷积神经网络提取特征,最后采用
SVM
对特征进行分类。而
Faster R-CNN
将区域建议过程统
一融合到卷积神经网络中,加速了训练和测试,实现了端到端的训练模型。
1.2
基于
regression
的
one-stage
检测算法
由于
two-stage
检测算法步骤较多,在现有的计算条件下难以支持实时检测。于是有学者
提出基于回归的算法,即给定输入图像,直接回归得出目标定位边框和目标类别。代表算法有
YOLO
和
SSD
。
YOLO
将图像划分为
s×
s
个网格,对这些网格中的图像计算目标边框的置信度
和框中目标所属类别的概率。而
SSD
则将
Faster R-CNN
中的锚点机制和回归思想结合,产生
多层特征图,对多尺度的物体特征进行回归。