1. 创新点
论文主要针对模型训练中出现的正负样本不均衡问题,根据困难样本挖掘原理,在原有的损失函数中引入调制因子,将背景部分视为简单样本,减小背景损失在置信损失中的占比,使得模型收敛更快速,模型训练更充分,从而提高了复杂背景下的目标检测精度。同时,通过构建特征金字塔和融合多层特征图的方式,实现对低层特征图的语义信息融合增强,以提高对小目标检测的精度,从而提高整体的检测精度。
2. 实现方法
本文检测模型以传统的基础网络VGG16 为基础,并添加深层卷积网络而构成。前部分浅层网络采用卷积神经网络提取图像特征,包括输入层、卷积层和下采样层。后部分深层网络用卷积层代替原始的全连接层。卷积层尺寸逐层递减,分类和定位回归在多尺度特征图上完成。
2.1 引入调制因子的损失函数
损失函数用来计算模型预测值与真实值的不一致程度。对样本集合(x,y),本文采用了多任务损失函数(Multi-Task Loss Function),可以在损失函数中完成置信度判别和位置回归,两者加权求和,得到最终的损失函数。
为解决正负样本不平衡问题,本文首先将所有的待训练先验框进行