参考博客:https://blog.csdn.net/u010712012/article/details/86555814
SSD网络模型
Choosing scales and aspect ratios for default boxes
各参数代表意义:
m:特征图的个数,本文是5(conv4_3是单独设置default box的)
sk: 表示default box大小相对于图片的比例(本文图片是300*300大小)
smin 和 smax: 表示比例的最小值与最大值,paper里面取0.2和0.9
由此: sk = 0.2 + 0.7/4(k-1) ,k ∈[1, 5]
以300*300大小的输入图片可以计算各特征图sk的大小分别为 60,111, 162,213,264
所以: 随着特征图大小降低,先验框尺度线性增加
此外,第一个特征图,其default box的尺度比例一般设置为 smin/2=0.1,那么尺度为 300×0.1=30
则6个特征图的default box的尺度分别为 30,60,111, 162,213,264
得到尺度后,下一步长宽比安排安排:
即:
Conv4_3 得到的feature map大小为3838:3838*4 = 5776
Conv7 得到的feature map大小为1919:1919*6 = 2166
Conv8_2 得到的feature map大小为1010:1010*6 = 600
Conv9_2 得到的feature map大小为5 * 5 :5 * 5 * 6 = 150
Conv10_2得到的feature map大小为3 * 3 :3 * 3 * 4 = 36
Conv11_2得到的feature map大小为1 * 1 :1 * 1 * 4 = 4
*4代表default box是长宽比为(1:1)、(2:1)、(1:2)、(1:1)这四个,*6则是添加了(1:3)、(3:1)这两个,即集合a中的元素