YOLO v3、SSD、Faster-RCNN目标检测算法对比

参考文献:yolo-v3和SSD的一些对比

SSDYOLOv3
LossSoftmax loss、Smooth L1 LossLogistic loss、回归损失和yolov1类似
Feature extractorVGG19(有改写)Darknet-53
Bounding Box Predictiondirect offset with default boxoffset with gird cell by sigmoid activation
Anchor boxDifferent scale and aspect ratioK-means from coco and VOC
Small objectsSemantic value for bottom layer is not high. Worse for small objects.Higher resolution layers have higher semantic values. Better for small objects.
Big objectsBetter. Feature map rangers from 38 * 38 to 3 * 3 ,1 * 1.Worse. 13 * 13 feature map is the most coarse-grained.
Data Augmentationdifferent sample IOU crop on original imagerandomly put the scaled original image (from 0.25 to 2) on the gray canvas
Inputresize original image to fixed sizeRandom multi-scale input
  • Bounding Box Prediction那里是grid_offset + sigmoid(offset)
  • Big Objects 那里是特征图取得shape越小大目标检测越好
  • 就单纯从网络来看,darknet在吸收了残差网络的优点之后,应该比vgg能力强一些
  • 在anchor boxes方面SSD固定8732个anchor boxes,而 YOLO v3 有52 * 52 * 3的一层 ,而且YOLO v3的输入是300到600间32的倍数,所以就anchor boxes数量来说应该是YOLO v3多
  • 速度上来说yolo自己给出的图是比ssd又快又精确,但我有些想不通,可能是因为darknet-53比vgg优秀很多,ssd把vgg网络还改写过(可能是这些原因)
    SSD和YOLO可以这么比较,是因为两个算法的步骤已经非常相似了
    特征提取 => anchor boxes =>loss

Faster-RCNN

1.在处理feature尺度问题上
Faster-RCNN 用ROI Pooling来统一proposal的尺度
SSD用Multi Layer来考虑各个尺度
YOLO用不同的输入考虑

2.Faster-RCNN多个rpn
这部分是Faster-RCNN的核心部分

3.只提取一个特征层
SSD和YOLOv3都对多个feature map进行提取

4.anchor boxes size取法不同
SSD的anchor boxes是算出来的
Faster-RCNN的是固定的
YOLO是用数据集的gt boxes 通过kmeans算出来的

5.feature extractor
SSD - VGG
YOLO - Darknet
Faster-RCNN - Inception-Resnet v2
注: 其实这些网络可以更改(但不是什么网络都能出结果,看了很多表格SSD+resnet并没有结果),这里写的是比较常用或者效果比较好的网络

6.Faster-RCNN慢的原因
Faster-RCNN在feature map每个像素点取9个anchor boxes
之后proposal数量

  • 10
    点赞
  • 55
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值