摘要
针对行人目标检测任务中目标检测速度慢及小目标难以检测的问题,提出一种融合CBAM注意力机制的YOLOv3多尺度目标检测模型。该算法首先以YOLOv3为基础网络进行特征提取,然后在YOLOv3的多尺度特征融合层新增一个两倍下采样特征图,用于补充小目标特征信息,最后在YOLOv3的各尺度特征图融合后加入卷积注意力模型(CBAM),以加强网络的特征表达能力。模型训练时使用DIOU损失函数代替较为主流的GIOU损失函数,并采用INRIA数据集进行实验。实验结果表明,改进后的YOLOv3目标检测模型精度和速度都有较大程度提升,检测精度最高提升了4.5%,检测速度提升了8帧/s,验证了该模型的可行性与有效性。
0 引言
行人目标检测主要应用于智能视频监控、人体行为分析、智能机器人等领域,是解决城市治安、交通监测、人流量统计等问题的关键技术,因此行人目标检测技术有着广阔的应用前景[1-5]。传统目标检测算法主要采用人工设计的特征进行检测,需要使用底层信息,运用