1.分类
vgg-resnet-inception-xception-senet
2.检测
r-cnn系列
yolo-ssd
3.多尺度
3.1FPN:采用resnet的策略,进行加法运算。——多尺度的做法。
自底向上其实就是网络的前向过程。在前向过程中,feature map的大小在经过某些层后会改变,而在经过其他一些层的时候不会改变,作者将不改变feature map大小的层归为一个stage,因此每次抽取的特征都是每个stage的最后一个层输出,这样就能构成特征金字塔。
自顶向下的过程采用上采样(upsampling)进行,而横向连接则是将上采样的结果和自底向上生成的相同大小的feature map进行融合(merge)。在融合之后还会再采用3*3的卷积核对每个融合结果进行卷积,目的是消除上采样的混叠效应(aliasing effect)。并假设生成的feature map结果是P2,P3,P4,P5,和原来自底向上的卷积结果C2,C3,C4,C5一一对应。
应用1:作者一方面将FPN放在RPN网络中用于生成proposal,原来的RPN网络是以主网络的某个卷积层输出的feature map作为输入,简单讲就是只用这一个尺度的feature map。但是现在要将FPN嵌在RPN网络中,生成不同尺度特征并融合作为RPN网络的输入。在每一个scale层,都定义了不同大小的anchor,对于P2,P3,P4,P5,P6这些层,定义anchor的大小为32^2,64^2,128^2,256^2,512^2,另外每个scale层都有3个长宽对比度:1:2,1:1,2:1。所以整个特征金字塔有15种anchor。
原文链接:https://blog.csdn.net/u014380165/article/details/72890275
4.遮挡
4.1注意力
5.样本不均衡
5.1focal-loss
5.2样本加权
6.增强操作
6.1噪声-随机修改
6.2随机删除
6.3剪切
7.模型剪枝
7.1模型蒸馏
本质是采用softmax的软得分来训练新的小模型。
其中0,1编码是硬编码。
7.2模型剪枝
采用权重的中位数进行剪枝。-核心百分位数。