1.目标检测(detection)= 目标分类(classification)+定位(localization)
一、classification with localization网络的输出形式如下:
y=⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢Pcbxbybhbwc1c2c3 ⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥
y
=
[
P
c
b
x
b
y
b
h
b
w
c
1
c
2
c
3
]
其中:
Pc
P
c
-is there any object,取0或1;
bx,by,bh,bw
b
x
,
b
y
,
b
h
,
b
w
-bounding box ;
c1,c2,c3
c
1
,
c
2
,
c
3
-which class does the object is
二、y的输出有两种
y=⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢1bxbybhbw010 ⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥
y
=
[
1
b
x
b
y
b
h
b
w
0
1
0
]
或者
y=⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢0??????? ⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥
y
=
[
0
?
?
?
?
?
?
?
]
?表示”don’t care”
三、损失函数定义
L(y^,y)=(y1^−y1)2+(y2^−y2)2+...+(y8^−y8)2
L
(
y
^
,
y
)
=
(
y
1
^
−
y
1
)
2
+
(
y
2
^
−
y
2
)
2
+
.
.
.
+
(
y
8
^
−
y
8
)
2
if y1= 1
L(y^,y)=(y1^−y1)2
L
(
y
^
,
y
)
=
(
y
1
^
−
y
1
)
2
if y1= 0
2.特征点检测
将输出改变为一些特征点输出,
3.滑动窗口目标检测
1.先用只有目标的图片进行训练,
2.选择合适的窗口,从左往后,从上往下一一进行检测,再换较大窗口去一一检测
或换不同的步长进行检测。
4.YOLO算法
左上坐标为(0,0)