YOLOv1, SSD
今年四月份的时候,在一个研究院实习时学习了YOLOv1, SSD系列Object Detection框架,现在总结一下。关于R-CNN系列框架的总结在上一篇blog。
一. YOLOv1(You Only Look Once)
1.1 框架结构
- 首先将图片调整为 448×448 448 × 448 大小;
- 运行神经网络(其中包括选取region proposal以及target confidence和coordinate输出);
- nms(Non-max Suppression, 非极大值抑制), 用于后续bounding-box的选取(选取置信度高且不重复的方框).
- 系统将输入图片分成 S×S S × S 个grid, 物体中心所在的grid负责检测这个物体. 每一个grid预测B个Bounding-box(边框)和Confidence Scores(置信度). 置信度的定义为:
Pr(Object)∗IOUtruthpred P r ( O b j e c t ) ∗ I O U p r e d t r u t h