摘要
针对传统的SSD目标检测算法在进行多尺度目标检测时,存在特征图有效信息弱和困难目标漏检率大等问题,提出一种改进的SSD目标检测算法。首先,在网络特征图输出处引入即插即用的轻量级注意力机制,通过不降维、局部跨通道交互以及核大小自适应选择等操作,在保持网络原始计算量的同时有效突出特征图中关键信息。该模块有利于增强背景信息和目标信息差,可以在有效提升网络性能的同时,不增加网络的复杂性。然后,构造了一种新的特征融合模块,可以将不同尺度的特征图进行有效融合,使浅层特征层既含有丰富的细节信息,又能充分利用上下文语义信息。多尺度融合模块有利于丰富特征图信息,提升网络对困难目标的检测性能。使用公开的PASCAL VOC数据集验证该方法,改进后的网络在PASCAL VOC2007测试集上的检测精度达到了79.6%,比原始SSD算法提升了2.4个百分点,在遮挡目标数据集上提升了4.7个百分点,充分证明改进方法具有一定的时效性和鲁棒性。
关键词: 目标检测; 深度学习; 轻量级注意力机制; 多尺度特征融合
目标检测是计算机视觉中最基本也是最关键的一项任务,在视频监控、智慧医疗等领域中都具有广泛的应用价值。高精度目标检测要求当给出一张图片或一段视频流时,可以准确地对图片或视频中的目标进行定位并识别出所属类别。然而目标自身的形状、颜色、姿势等因素,以及外界的遮挡、光照等条件</