基于图片的检测算法
two-step:RCNN、SPPnet 、Fast-RCNN、Faster-RCNN
one-step:YOLO、SSD、YOLOv2 、YOLOv3
优点:实时性
缺点:准确率不高,不如Faster R-CNN,定位精度差,anchor box不够丰富且只回归修正一次;小物体差:anchor的scake不够多样;不规则物体差:anchor的ratio不够多样
default box、anchor box都称为先验框
- RCNN 把CNN提取特征引入目标检测
- SPPnet 提取特征时共享卷积节省计算量
- Fast R-CNN 分类回归也放到神经网络里做
- Faster R-CNN 把预选框的提取也放到神经网络里做
- Mask R-CNN 除了做检测还做了分割
实战源码:https://github.com/andylei77/object-detection
实现的是对图片给出一个框识别其中的物体