darknet-yolov3学习笔记:
-
416416输入,5次下采样,输出三种尺度(8倍采样:5252,16倍采样:2626,32倍采样:1313)。
-
聚类得到三种尺度的共9个anchor box,1313:((116 ,90); (156 ,198); (373 ,326),大目标检测),2626:((30,61); (62,45); (59,119),中目标检测),56*56:((10,13); (16,30); (33,23),小目标检测)。
-
每个cell预测anchor box的三个框,416416输入时输出(5252+2626+1313)*3=10647个proposal box。
-
训练过程中采用设置阀值的IoU(交并比)评估预测值与真实值的偏差,从而训练输出各proposal box的置信度,根据各置信度通过非极大抑制(NMS)机制,设置阀值,预测模型置信度为极大值的目标框(多个)。
-
可以通过kmeans聚类自己数据集的anchor box,然后按照FPN的结构修改cfg文件下的anchors参数。