0. 摘要
fasterrcnn两阶段(回归+分类)1.是不是物体,2.是哪个物体
-
打框位置好不好,预测框和gt重合度越高,打的框越好
-
假正例:人脸打到鞋上。假正例越少越好。框准不准,没有假正例尴尬
-
全连接会将整个图片所有信息进行整合汇总。faster是将proposal 的框进行全连接。yolo是将整个图片进行全连接
-
DPM:图像金字塔-->滑动窗口-->分类器,
-
yolov1,16年5月出的,faster已经出了,准确率上比不过faster,时间速度上比得过
1. Introduction
1、图片大小为448*448
2、卷积网络
3、非极大值抑制
-
每秒超过24帧,即可实现实时性
-
拿到整个图片信息,即可得到上下文信息,会影响框的位置。faster先提候选框,就看不到上下文信息。
-
框的定位不是很准,尤其是对于小的物体。分类是没问题的。
优点:
-
假正例少
-
快,45帧每秒
-
泛化能力强
缺点:
-
框的定位不准
2. Unified Detection
-
每一个bounding box,使用整张图的特征
-
如果一个物体的重心落在了cell单元里,这个cell单元负责预