研究领域:目标检测、虫害检测
论文题目:大田环境下的农业害虫图像小目标检测算法
作者:蒋心璐 ; 陈天恩 ; 王聪 ; 李书琴 ; 张宏鸣 ; 赵春江
出版期刊(会议):计算机工程与应用
时间:2023
研究背景
#(重点叙述问题的提出、简要叙述有哪几个创新点)
本文致力于解决田间复杂问题下小目标害虫难以检测和目标遗漏的问题。小目标对边框的偏移更加敏感,因此使用SIoU计算边框交互比以减少预测框震荡情况。使用VFL函数计算目标置信度和分类损失以解决样本不平衡问题。大田环境存在各种颜色、体型与目标害虫相似的干扰物,这种情况下小目标害虫检查任务难度高,所以引入注意力机制让网络更加关注目标害虫的相关信息。
创新点:
提出了一种改进YOLOv5的小目标害虫检测算法Pest-YOLOv5,以提高害虫测报的灵活性。
在特征提取网络中增加坐标注意力机制,通过结合空间和通道信息,增强对小目标害虫特征的提取能力,在颈部连接部分使用加权的双向特征金字塔网络结构,通过融合多尺度特征,缓解多次卷积带来的小目标信息丢失问题。
使用SIoU计算边框交并比(IoU)减少预测框震荡情况,变焦损失(VEF)计算目标置信度损失和分类损失解决样本不平衡问题,同时通过实验得到最优分类损失权重系数,提高小目标害虫检测精度和网络收敛速度。
方法
#(详细叙述方法的要点,主要是作者创新点)
以YOLOv5为主网络,改进为pest-YOLOv5,网络结构如下:
各个模块结构:
结合坐标注意力机制的步骤:①嵌入空间坐标信息,将输入特征沿水平或垂直方向进行平均池化,生成水平和垂直2个具有方向感知的特征图,这对特征图分别沿水平和垂直方向路径捕获远距离依赖关系。②生成注意力,在空间维度上拼接上述2个特征图,1×1卷积降维,BN层和非线性激活层在垂直和水平方向上对空间信息进行编码以生成具有空间位置信息的注意力图。③使用1×1卷积降维,并使用sigmoid激活函数进行归一化和加权。④将2个注意力图应用于原输入特征图,实现空间坐标信息在通道上的加权融合。之所以要在那个位置引入注意力模块是因为在主干网中随着卷积次数增加,特征图的特点由高分辨率、少通道变为低分辨率、多通道。第10层通道信息丰富,在此加坐标注意力可以将注意力机制编码的空间信息充分嵌入到通道中,加强主干网络对于空间坐标信息的利用,有利于提高对小目标的定位和识别能力。
本文使用BiFPN改进颈部连接结构,通过融合多尺度特征进行特征增强,在原模型路径聚合网络(PANet)结构的相同层级特征路径基础上增加了来自原输入的特征,在主网络的第21层加入了来自第7层的特征,删除了没有进行特征融合的单输入节点,通过跨尺度连接从不同分辨率的特征图中获取特征,并考虑对定位和分类的贡献进行分配相应的权重。本文中还使用了Concat代替了add操作进行BiFPN进行特征融合,避免了add操作带来的信息损失。
损失函数由定位损失、目标置信度损失、分类损失三部分组成。
评价指标:准确率P、召回率R和平均精度均值(mAP)。
Goodness
#(实验讨论,对方法优势的理解)
在公开数据集 AgriPest上的实验结果表明,Pest-YOLOv5 模型 mAP0.5和召回率分别为 70.4% 和 67.8%,优于原 YOLOv5s 模型、SSD 和 Faster R-CNN 等经典目标检测模型。与 YOLOv5s 模型相比,Pest-YOLOv5 模型将 mAP0.5、mAP0.50:0.95和召回率分别提高 8.1%、7.9% 和 12.8%,改善了目标检测情况。
讨论
#(思考文献对自己的启发)
YOLOv5+注意力+BiFPN+Loss改良
注意解决预测框震荡的一种方法为更换不同的IoU,样本不平衡的一种解决方案是改变置信度损失和分类损失的计算。
小目标问题可以通过注意力和特征融合的方式进行改善。
Study
#(对论文中出现的一些概念进行记录和学习)
**主流的小目标定义:**包括绝对尺寸和相对尺寸2种方式。COCO数据集提出小目标的绝对定义,将像素点数小于32×32的物体定义为小目标。相对定义则根据目标在原图中所占的面积比例进行定义,若相同类别下所有对象边界框的面积与原图面积比例的中位数在0.08%~0.58%之间,则将该物体定义为小目标
**FPN:**利用深度卷积神经网络在不同层次上提取的特征构建一个特征金字塔在传统的卷积神经网络中,随着网络层次的加深,特征图的空间分辨率逐渐降低,而语义信息则逐渐增强。这意味着网络底层的特征图包含更多的细节信息,适合检测小物体;而顶层的特征图包含更多的语义信息,适合检测大物体。然而,单独使用任一层次的特征图都难以同时实现对不同尺度物体的高效检测。
为了解决这一问题,FPN 采用自底向上、自顶向下和横向连接三个方向的信息流动,有效地融合了不同层次的特征