目标检测常见的框架

最新推荐文章于 2024-08-05 17:08:52 发布

看不见我呀

最新推荐文章于 2024-08-05 17:08:52 发布

阅读量3.8k

点赞数

分类专栏：机器学习实战

本文链接：https://blog.csdn.net/gaotihong/article/details/101321459

版权

机器学习实战专栏收录该内容

26 篇文章 0 订阅

订阅专栏

1.分类

vgg-resnet-inception-xception-senet

2.检测

r-cnn系列

yolo-ssd

3.多尺度

3.1FPN:采用resnet的策略，进行加法运算。——多尺度的做法。

自底向上其实就是网络的前向过程。在前向过程中，feature map的大小在经过某些层后会改变，而在经过其他一些层的时候不会改变，作者将不改变feature map大小的层归为一个stage，因此每次抽取的特征都是每个stage的最后一个层输出，这样就能构成特征金字塔。
自顶向下的过程采用上采样（upsampling）进行，而横向连接则是将上采样的结果和自底向上生成的相同大小的feature map进行融合（merge）。在融合之后还会再采用3*3的卷积核对每个融合结果进行卷积，目的是消除上采样的混叠效应（aliasing effect）。并假设生成的feature map结果是P2，P3，P4，P5，和原来自底向上的卷积结果C2，C3，C4，C5一一对应。
应用1：作者一方面将FPN放在RPN网络中用于生成proposal，原来的RPN网络是以主网络的某个卷积层输出的feature map作为输入，简单讲就是只用这一个尺度的feature map。但是现在要将FPN嵌在RPN网络中，生成不同尺度特征并融合作为RPN网络的输入。在每一个scale层，都定义了不同大小的anchor，对于P2，P3，P4，P5，P6这些层，定义anchor的大小为32^2,64^2,128^2,256^2，512^2，另外每个scale层都有3个长宽对比度：1:2，1:1，2:1。所以整个特征金字塔有15种anchor。
原文链接：https://blog.csdn.net/u014380165/article/details/72890275

4.遮挡

4.1注意力

5.样本不均衡

5.1focal-loss

5.2样本加权

6.增强操作

6.1噪声-随机修改

6.2随机删除

6.3剪切

7.模型剪枝

7.1模型蒸馏

本质是采用softmax的软得分来训练新的小模型。