deeplearning.ai 总结 - YOLO算法输出维度的计算方法
flyfish
pc
p
c
表示矩形区域是目标的概率,数值在0~1之间
bx,by
b
x
,
b
y
表示目标中心位置坐标
bh,bw
b
h
,
b
w
表示目标所在矩形区域的高和宽
c
c
表示表示类别,有多少个类别就有多少个
图片左上角为原点 (0,0) ( 0 , 0 ) ,右下角为 (1,1) ( 1 , 1 ) 。
输出内容的列向量中先要包含以下6个部分
(pc,bx,by,bh,bw,c)
(
p
c
,
b
x
,
b
y
,
b
h
,
b
w
,
c
)
如果要同时检测两个目标,就设置两个Anchor Boxes
例如Anchor box 1检测人,Anchor box 2检测车。
计算方法
例如我们将图片分割成3*3的网格,算法可以识别3类目标(pedestrian, car, motorcycle),我们有两个Anchor Boxes
那么输出维度是
3*3*(5+3)*2
按照上图计算
就是
19*19*(5+80)5