问题1: yolo算法检测密集目标时,易漏检,例如多匹马并排站在一起,只能预测出部分马的位置
思考:NMS后处理时将得分较低的预测结果滤除了,降低部分检出率.
改进1:用soft NMS,只改变预测得分,而不是舍弃得分较低的预测结果,避免一刀切问题,保留大量预测结果,可提高检出率。
新问题1:大量预测结果,使得后处理时间急剧上升。
改进2:适当提高NMS阈值,保留较多的预测结果,然后将同一类缺陷的重叠结果进行合并,以减少漏检。
问题2: yolo算法使用固定尺寸图像进行训练,对于长条状(图像长边是短边的数倍)图像或不同尺寸混合图像数据集,检测效果较差。
思考1:长条状图像送入网络前,会将其等比例填充为长边的尺寸,然后按照设定的输入尺寸进行缩放,使得部分目标缩放后不易识别;不同尺寸(差异较大)图像混合训练,按照统一尺寸进行缩放,会使得图像的缩放比例不同,特征提取的维度有所差异,影响检测效果。
改进1:对输入图像做滑动窗口裁剪操作,这样既不改变图像分辨率,又满足固定尺寸输入。
新问题1 :滑动窗口裁剪操作,会面临原图尺寸远小于或远大于设定尺寸问题。
改进2: 根据业务需要,添加缩放机制,适当缩放图像尺寸。
新问题2: 裁剪操作,使得输入图像感受野变小(局部图像作为输入),带来严判(将背景判为目标)。
改进3:适当增大图像裁剪尺寸和图像缩放因子,使得图像被裁剪的数量较少,从而获得更多原图信息;增加OK品图像(纯背景图像)进行训练。
参考
1 soft NMS: https://blog.csdn.net/u014380165/article/details/79502197